﻿Reducerea spatiului starilor 13 Reducerea spatiului starilor Pentru circuite programe aritmetice: abstractia definita de b(a-) — x mod n, n   Z Pastreaza relatiile primitive aritmetice, pentru ca ((a- mod n) + (y mod n)) mod іг — (a- + y) mod n, etc in plus (ierna chineza a resturilor): daca ni, -nk relativ prime, si n = ni   n-2     n*, atunci x = y (mod n) o A*=1 x = y (mod ii, ) => pentru a verifica un sistem cu aritmetica pe 16 biti, e suficienta verificarea pentru intregi modulo 5, 7, 9, 11, 32 (produs > 21 ) Pentru verificarea cailor de date ale unui sistem (functia principala: calculul si transmiterea unor valori) Exemplu: transmiterea corecta din a in b initial: pt valoare fixa: AG(a = 17 , AXfi = 17) Functia de abstractie: h(x} = -f i aca — i7 v ' t 0 in caz contrar Mai general: introducem parametrul simbolic c: h( y = J 1 daca x = c ' J t 0 in caz contrar => relatie de tranzitie abstracta R(a,a',6, b', c) intr-o reprezentare cu BDD-uri, c practic nu creste complexitatea daca comportamentul sistemului e independent de c Exemplu: sumator cu pipeline pe doua cicluri: AG(regl = a A rrg2 — b —> AX AXswn = a + b) Verificare formala Curs 7 Marius Minea Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 15 Reducerea spatiului starilor 16 Spatiul starilor unui sistem — produsul componentelor: S — ,si x x,Sn => exponential in numarul componentelor, adesea imposibil de construit Daca specificatiile sunt automate: pot "ghida" algoritmul de verificare, construind doar portiunile necesare ale spatiului starilor Se construieste doar automatul 5 din negatia specificatiei Din starea s — (r,q) cu r e A si g   S: - se considera doar acei succesori ai lui r cu tranzitii etichetate la fel ca tranzitiile din g (din specificatie) - la gasirea unui (contra)exemplu, explorarea se incheie inainte de a fi explorat intreg spatiul starilor Verificare formala Curs 7 Marius Minea ideea de baza: construirea unui model redus - spatiul de stari si traiectoriile sunt submultime ale celor originale Justificarea: traiectoriile excluse nu aduc un plus de informatie - relatie de echivalenta intre traiectorii - specificatia nu poate distinge intre traiectorii echivalente - modelul redus contine un reprezentant din fiecare clasa Denumirea: initial, bazata pe ordonarea partiala a tranzitiilor Mai generic: model checking cu reprezentanti Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 17 Reducerea spatiului starilor 18 Compozitia asincrona => ordonare arbitrara a evenimentelor concurente => и tranzitii genereaza ii! ordonari si 2" stari => "explozie" combinatoriala (exponentiala) a spatiului starilor Modelul: sistem de stari-tranzitii (5, T, S'q, L) O tranzitie а   T e o submultime а C S x S (privita ca o familie de tranzitii elementare etichetate la fel) Tranzitie activata in s: а   enabled(s) <> 3s'   S а(з, s') Consideram doar tranzitii deterministe' Va,s 3!s' a(s, s') - sistemul insa poate fi nedeterminist, daca |enab ed(s)| > 1 : doua conditii, Vs e S: Activare', a, fi   enabled(s) => a   епаЫесі(іЗ(зУ) A d   enabled(a(s y) - doua tranzitii independente nu se pot dezactiva reciproc - dar una o poate activa pe cealalta Comutativitate: a,d   enabled(s) => a(^(s)) — d(a(s')') - efectul executiei e acelasi independent de ordine Verificare formala Curs 7 Marius Minea Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 19 Reducerea spatiului starilor (in raport cu AP' C AP) a e T invizibila <> Vs, s' e s, s' — a(s)  => L(s) П AP' — L(s') П AP' (nu schimba etichetarea cu propozitii din AP') in practica: AP' — propozitiile atomice din specificatie in compozitia asincrona, operatorul X nu este relevant: - doua tranzitii in componente diferite pot fi ordonate arbitrar - doua tranzitii in aceeasi componenta pot fi separate de tranzitii in alte componente => starea locala in componenta ramane aceeasi Doua traiectorii infinite тг — sqsj si тг' — sunt echivalente la repetitie (stuttering equivalent'i, ir  -"т V daca pot fi divizate in blocuri finite de stari identic etichetate: 3 sirurile infinite o — ip a-i- Vi > 0 L(Sjt) = L(sjt+i) = Ь(зй +1 і) = Р(гл) = Р(гл+і) = Ь(сл+1 і) O formula LTL А  este invarianta la repetitie (stuttering invariant) daca ViT, Тг' CU ТГ 70, 7Г |= f <> Тг' |= f Teorema: Orice formula in LTi v (fara operatorul X) este o propri- etate invarianta la repetitie, si reciproc Verificare formala Curs 7 Marius Minea Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor Reducerea spatiului starilor Modelul redus e construit selectand din fiecare stare doar o submultime de tranzitii din cele activate in acea stare Selectia se face pastrand pentru fiecare cale din modelul original M o cale repetitiv echivalenta in modelul redus M' => ѴА    LTL x M |= А  O M' |= А  Diverse criterii de selectie si denumiri: stubborn sets [Valmari], persistent sets [Godefroid]; utilizam ample sets [Peled], Selectia tranzitiilor: descrisa printr-un set de conditii: СО: ample(s) = 0 <> enabled(s) = 0 Succesor in modelul original => exista un succesor in modelul redus Verificare formala Curs 7 Marius Minea Ci O traiectorie din s nu poate executa o tranzitie dependenta de o tranzitie din ample(s) inainte de a fi executat o tranzitie din ample(s) Proprietate: Tranzitiile din ample(s) sunt independente de cele din enabled(s)   ample(s) => orice traiectorie dintr-o stare s are una din formele: - un prefix аіаі - ani3, unde 0 e ample(s), si a,- independente de 0 - un sir infinit apai , cu a,- independente de orice 0 e ample(s) C2 (invizibilitate) ample(s) enabled(s) => ample(s) C invisible(s) Daca s nu e explorat complet, tranzitiile din ample(s) sunt invizibile Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 23 Reducerea spatiului starilor 24 C3 O tranzitie activata in toate starile unui ciclu trebuie inclusa in ample(s) pentru o stare s din ciclu - garanteaza ca nu sunt ignorate portiuni din spatiul starilor datorita ignorarii persistente a unei tranzitii - implementare: in orice ciclu, o stare e explorata complet Pt traiectoria tt din s, construim una echivalenta тг' in modelul redus: a) daca urmatoarea tranzitie e in ample(s), o adaugam la тг' b) urmatoarea tranzitie din тг nu e in ample(s) => cf C2 tranzitiile din ample(s) sunt invizibile (3 tranzitii   ample(s)) bl) daca in тг mai urmeaza o tranzitie 0 e ample(s), se adauga la тг' - cf Ci, 0 e independenta de tranzitiile precedente - e invizibila, deci comutareea nu afecteaza specificatia b2) nu exista tranzitii din ample(s) in тг => se adauga tranzitie arbitrara 0 e ample(s) la тг' - cf Ci nu dezactiveaza tranzitiile urmatoare - e invizibila => nu afecteaza specificatia - cf C3 acest caz apare in numar finit Verificare formala Curs 7 Marius Minea Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 25 Reducerea spatiului starilor 26 Conditiile nu se pot verifica direct => euristici conservatoare - Tranzitii care citesc si scriu o variabila comuna sunt dependente - Alegeri conditionale in acelasi proces sunt dependente - Tranzitiile de comunicatie intra in dependentele ambelor procese - Operatiuni de transmitere pe acelasi buffer sunt dependente La fel, pt operatiuni de receptie Tranzitii cu multimi disjuncte de procese sunt independente => selecteza o multime P de procese care in starea curenta nu au operatii de comunicatie cu procese din afara lui P => ample(s) — tranzitiile activate din P ideal: putine tranzitii in ample(s) (ex tranzitie locala intr-un proces) Verificare formala Curs 7 Marius Minea implementarea directa a conditiilor: reprezentare explicita a starilor - C3 e cel mai usor de verificat intr-o explorare DFS Obs: C2 si C3 limiteaza potentialul de reducere => pot fi combinate: C2': Daca ample(s) пт* 0, se explorat complet, unde T*: - contine toate tranzitiile vizibile - orice ciclu din modelul redus contine o tranzitie din T* Determinarea unei multimi T* se poate face static => reducerea enabled -tample inclusa in model (precompilare) => nu necesita modificarea algoritmilor de verificare => combinatie: reducere cu ordonare partiala + explorare simbolica => eficienta pentru sisteme mixte hardware software Verificare formala Curs 7 Marius Minea Programarea calculatoarelor Adrese Tablouri siruri de caractere Marius Minea 8 aprilie 2008 Programarea calculatoarelor Curs 7 Marius Minea Orice variabila are o valoare, si un tip care determina numarul de octeti de memorie ocupati (sizeof) Acesti octeti se afla la o anumita adresa da adresa operandului: &x e adresa variabilei x Operandul lui &: orice (destinatie valida a unei atribuiri) - nu au adrese: expresii arbitrare, constante, etc O adresa poate fi tiparita (in hexazecimal) cu formatul 7 p in printf #include int main(void) { double d; int n; printf("Adresa lui d: 7 p n", &d);    de ex 0xbff60f38 printf("Adresa lui n: 7 p n", &n);    de ex 0xbff60f34 return 0; } Programarea calculatoarelor Curs 7 Marius Minea Programarea calculatoarelor Adrese Tablouri siruri de caractere Programarea calculatoarelor Adrese Tablouri siruri de caractere 4 Tablou (vector) = o secventa de elemente de de date asociaza o (rn) cu un anumit (n) (ca un sir matematic) Declarare: tip nuine-tablou[nr-elem]; double x ; int mat ; initializat: intre acolade, cu virgule: int a = { o, 1, 4, 9 - tabloului e la care incepe memorarea elementelor - tabloului (nr de elemente) = o pozitiva C99: dimensiuni variabile, dar valoare cunoscuta la momentul declararii ex parametru la functie: int f(int n) { int tab[n];   folosim tab } - un : dat de numele tabloului si un indice intreg: x ; ca indice se poate folosi orice expresie de valoare intreaga - un element de tablou poate fi folosit ca orice variabila individuala (are o valoare, si poate primi una noua, in stanga unei atribuiri) in C, numerotarea elementelor incepe de la zero! int a ; are elemente a[o], a[l], a , a , NU exista a Sintaxa declaratiei: tip aidimens]; sugereaza ca atindice] are tipul tip Programarea calculatoarelor Curs 7 Marius Minea #include #define MAX 100 int main(void) { unsigned p [MAX] = {2};    primul element initializat cu 2 unsigned cnt = 1, n = 3;    avem un prim, 3 e urmatorul candidat do { for (int j =0; n % pEjl; ++j)    cat timp nu am gasit divizor if (p[j]*p[j] > n) {    daca nu mai sunt altii e prim p[cnt++] = n; break;    il inregistram si iesim din ciclu ++n;    trecem la numarul urmator } while (cnt numele tabloului NU poarta informatii despre dimensiunea iul exceptie: sizeof (numetab) este nr-elem * sizeof (t p-e em) La functii trebuie transmis tabloului ( ) si sa scriem lungimea intre [] la parametru, nu e luata in considerare #include void printtab(int t[], unsigned len) { for (int i = 0; i un parametru tablou e transmis prin Avand adresa, functia poate accesa ( ) elementele tabloului void sumvect(double a[], double b [] , double r[], unsigned len) { for (unsigned i = 0; i void fractie(unsigned m, unsigned n) { int apare[n];    dimensiune data de parametrul n for (int i = 0; i trebuie cunoscut col => la parametri trebuie toate dimens in afara de prima Ex: A^nxiox 5Юхб — &ипхб void matmul(double a[] ,double b[] , double c [] , int lin) { for (int i = 0; i 0 dupa cum e sl fata de s2 char *strncpy(char *dest, const char *src, size t n);    copiaza cel mult n caractere din src in dest char *strncat(char *dest, const char *src, size t n);    concateneaza cel mult n caractere din src la dest int strncmp (const char *sl, const char *s2, size t n);    compara sirurile pe lungime cel mult n caractere size t: tigintreg fara semn gentru dimensiuni const: sbecificator de tip, indica ca obiectul resbectiv nu e modificat Programarea calculatoarelor Curs 7 Marius Minea Programarea calculatoarelor Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 15 noiembrie 2004 La nivel de , ne referim la un fisier prin La nivelul , bibliotecile limbajului C definesc un tip cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF) Din punct de vedere logic, un fisier e un flux (stream) de octeti Lucrul tipic cu fisiere: se deschide, se prelucreaza, se inchide Fisiere standard predefinite (si deschise automat la rulare) : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pentru a putea fi separate (prin redirectare) de mesajele normale de iesire Programarea calculatoarelor 2 Curs 7 Marius Minea Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C Fisiere Functii sistem Preprocesorul C FiLE *fopen (const char *path, const char *mode); - arg 1: numele fisierului (absolut sau fata de directorul curent) - arg 2: modul de deschidere; primul caracter semnifica: : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, e trunchiat la 0 (w) sau se adauga la sfarsit (append, a) in plus, sirul de caractere pt modul de deschidere mai poate contine: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod binar (implicit: in mod text) - returneaza NULL in caz de eroare (trebuie testat ii!) - altfel, valoarea returnata se foloseste pt lucrul in continuare int fclosetFiLE *stream); - scrie orice a ramas in tampoanele de date, inchide fisierul - returneaza 0 in caz de succes, EOF in caz de eroare Programarea calculatoarelor 2 Curs 7 Marius Minea Secventa tipica de lucru cu un fisier (ex pt citire) FiLE *fp; char *name = "f txt";  * sau din argv[], sau solicitat *  if (i(fp = fopen(name, "r"))) f  * trateaza eroarea *  } else {  * lucreaza cu fisierul *  } if (fclose(fp))  * eroare la inchidere * ; La intrarea-iesirea in mod text se pot petrece diverse conversii in functie de implementare (de exemplu traducere  nin  r n pt DOS) Datele citite corespund celor scrise doar daca: toate caracterele sunt tiparibile,  t sau  n;  n nu e precedat de spatii; ultimul caracter e  n => pentru orice alte situatii, deschideti fisierele in mod binar (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc acelasi indicator de pozitie => Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 5 Fisiere Functii sistem Preprocesorul C Cu functii echivalente celor folosite pana acum: int fputc(int c, FiLE *stream);  * scrie caracter in fisier *  int fgete(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s);  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga " 0* la sfarsit => citirea sigura a unei linii, fara depasire #include void cat(FiLE *fi)  ( int c; while ((c = fgetc(fi)) != EOF) putchar(c); } void main(int arge, char *argv[J)  { FiLE *fp; if (arge == 1) cat(stdin);  * citeste de la intrare *  else while (—arge > 0) {  * pt fiecare argument *  if (!(fp = fopen(*++argv, "r"))) fprintf(stderr, "can't open %s", *argv); else { cat(fp); fclose(fp); } Programarea calculatoarelor 2 Curs 7 Marius Minea Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 7 Fisiere Functii sistem Preprocesorul C 8 void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * 1= 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * != 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum); din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s);  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Programarea calculatoarelor 2 Curs 7 Marius Minea Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t nmemb, FiLE *stream); size t fwrite(void *ptr, size t size, size t nmemb, FiLE *stream);  * citesc scriu nmemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror in C, nu exista fisiere tipizate (file of din PASCAL); putem insa defini astfel de functii pentru fiecare tip in parte: size t readint(int *pn, FiLE *stream)  * in format binar *   ( return fread(pn, sizeof (int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *   ( return fwrite(&x, sizeof (double), 1, stream); } Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 9 #include #include #define MaX 512 int filecopy(FiLE *fi, FiLE *fo)  ( char buf [MaX] ; int size;  * nr octeti cititi *  while (ifeof(fi))  ( size = fread(buf, 1, MaX, fi); fwrite(buf, 1, size, fo);  * scrie doar size *  if (ferror(fi) || ferror(fo)) return errno; return 0; Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 10 void main(int argc, char *argv[J) FiLE *fi, *fo; if (argc != 3)  ( fprintf(stderr, "usage: сору source destination n"); exit(-l); } else { if (! (fi = fopen(argv[l] , "r")))  ( fprintf(stderr, "%s: can’t open %s: ", argvEO], argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (!(fo = fopen(argvE2] , "w")))  ( fprintf(stderr, "%s: can’t open %s: ", argvEO], argvEa]); perror(NULL); exit(errno); if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) i fclose(fo)) perror("Eroare la inchidere"); Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 11 Fisiere Functii sistem Preprocesorul C 12 Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long fteii(FiLE *stream);  * pozitia de la inceputul fisierului *  int fseek(FiLE *stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: seek set (inceput), seek cur (punctul curent), seek end (sfarsit) void rewind(FiLE *stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflushfFiLE *stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Programarea calculatoarelor 2 Curs 7 Marius Minea void abortO; cauzeaza terminarea a programului; efectul pt tampoanele de date si fisierele deschise depinde de implementare int atexitfvoid (*func)(void)); inregistreaza functii pt apelare la terminarea normala a programului (actiuni specificate de programator, ex "doriti sa salvati fisierul ?") void exitdnt status); termina normal executia programului, -intai se apeleaza functiile inregistrate cu atexit in ordine inversa - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO int system(const char *string); se executa comanda string (cu argumente) de procesorul de comenzi; daca string e null, returneaza l= 0 daca exista procesor de comenzi Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 13 Fisiere Functii sistem Preprocesorul C int remove(const char *filename); sterge un fisier int rename(const char *old, const char *new); redenumeste un fisier ambele functii returneaza o la succes si l= 0 la eroare file *tmptiie(void); creeaza fisier temporar, deschis in mod wb+ sters automat la sfarsit de program; de ex pt date temporare mari char *tmpnam(char *s); genereaza returneaza un nume nou de fisier numele e copiat si in s daca s e nenul (necesar: minim L tmpnam octeti) FiLE *freopen(const char * filename, const char * mode, FiLE * restrict stream); deschide fisierul filename si Ti asociaza cu fluxul stream (redirecteaza fluxul logic stream in fisierul fizic filename; returneaza null in caz de eroare, stream la succes inchide un eventual fisier asociat anterior cu stream) poate fi folosit pentru redirectarea intrarii iesirii din program Programarea calculatoarelor 2, Curs 7 Marius Minea #include Sinclude int fatal(char *msg)  ( perror(msg) ; exit(l); } int main(int arge, char **argv) char s ; if (arge != 2) fatal("lipseste nume fisier"); if (!freopen(argv[l], "r", stdin)) f atalC'eroare la deschidere redirectare intrare"); if (!freopen(tmpnam(NULL), "w+", stdout)) f atalC'eroare la creare redirectare iesire"); if (systemC'sort")) f atalC'eroare la sortare"); if (fseek(stdout, 0, SEEKJ5ET)) fatalC'eroare repozitionare");  * prelucram fisierul de iesire; aici doar tiparim *  while (fgets(s, 80, stdout)) fprintf(stderr, "%s", s); felose(stdin); felose(stdout); Programarea calculatoarelor 2, Curs 7 Marius Minea Fisiere, Functii sistem, Preprocesorul C 15 Fisiere, Functii sistem, Preprocesorul C Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf(s, "%d", &n);  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu %n) *  Programarea calculatoarelor 2, Curs 7 Marius Minea Functiile de tipul printf scanf au numar variabil de argumente ( ) Pentru a implementa o astfel de functie, trebuie un mod de acces la argumentele cu numar variabil, pornind de la ultimul arg numit => limbajul C defineste o serie de macro-uri in stdarg h - tipul va iist pentru a retine informatii despre lista de argumente void va start(va list ap,u t marg); - initializeaza ap pornind de la adresa ultimului argument tip va arg(va list ap, tip); - returneaza urmatorul argument din lista, presupus a fi de tipul tip apelata repetat pentru fiecare argument; tipul argumentelor si numarul lor trebuie deduse din argumentele fixe (ex formatul la print scanf) void va copy(va list dest, va list src); - copiaza un va iist, inclusiv punctul curent de prelucrare atins void va end(va list ap); - apelat pentru incheierea corecta a prelucrarii argumentelor Programarea calculatoarelor 2, Curs 7 Marius Minea Fisiere, Functii sistem, Preprocesorul C 17 Fisiere, Functii sistem, Preprocesorul C 18 - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie Sinclude sau Sinclude "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) Sdefine LEN 20  * substitutie textuala simpla *  int tab[LEN];  * pentru definirea de constante simbolice *  for (i = 0; i (В) ? (A) : (B)) Sdefine swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } Obs: substitutia se face textual => pot aparea probleme subtile - folositi paranteze in Jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Programarea calculatoarelor 2, Curs 7 Marius Minea pt a compila selectiv portiuni de cod din program in functie de optiuni (caracteristici arhitecturale; pt depanare; functionalitate in plus; etc) Sintaxa: grup-cod ;;= test-if grup-cod grupuri-e!ifi;!,: grup-elseopt Sendif test-if ;;= Sif expr-const | sifdef identificator | sifndef identificator grup-elif ;;= Selif expr-const grup-cod (toate s apar grup-else ;;= Seise grup-cod pe linie noua) expr-const ;;= cele obisnuite | defined identificator Sdefine DEBUG  * daca depanam *  Sif defined GNUC  * compilator GNU *   * cod obisnuit *  Sif GNUC == 2  * versiunea 2 *  Sifdef DEBUG  * cod specific pt- versiune *  printfC'am ajuns aici, x = Seise  * alta versiune *  Sendif  * cod specific pt- alta versiune *   * alt cod obisnuit *  Sendif Sendif identificatori predefiniti: file line date" time Ex: fprintf(stderr, "eroare in %s linia %d n", FiLE , LiNE ); Programarea calculatoarelor 2, Curs 7 Marius Minea Pointeri in limbajul C, orice variabila are o : o valoare numerica; indica locul din memorie unde e memorata valoarea variabilei da adresa operandului: &x e adresa variabilei x Operandul: orice poate folosit pe partea stanga a unei atribuiri (variabila, element de tablou, functie; NU pentru expresii oarecare) O adresa poate fi tiparita (in hexazecimal) cu formatul %pin printf б noiembrie 2003 Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 3 #include double d; int a ; int main(void) int k; printf("Adresa printf("Adresa printf("Adresa printf("Adresa }  * Obs &a -  * variabile globale *  variabila locala *  %p n", &d);  * de &a ); &a );  * d: a : 7"p n' a : 7"p n' k: 7"p n", &k) ; lui lui lui lui &a == 5 * sizeof(int) Utilizarea si programarea calculatoarelor Curs 7 Pointeri ex 0x80496c0 *  0x80496e0 *  0x80496f4 *  0xbffff8e4 *  (pozitii consecutive) *  Marius Minea Orice expresie in C are un tip => la fel si expresiile adresa : Daca variabila x are tipul tip, &x are tipul tip * int x; =t &x are tipul int *, adica pointer la int (adresa de int) char c; => ftc are tipul char *, (pointer la char, adresa de char) => exista tipuri de adresa diferite pentru fiecare tip de date => putem variabile de aceste tipuri (pointeri): tip * numc var; nume var e pointer la (adresa pt ) o valoare de tip = o variabila care contine adresa altei variabile da obiectul *p de la adresa data de operandul p Operand: pointer Rezultat: referinta la obiectul indicat de pointer => operator de indirectare (dereferentiere, referire indirecta prin adresa) : Daca pointerul p are tipul tip *, *p are tipul tip Sintaxa declaratiei (aceeasi dar citita in doua feluri) sugereaza folosirea: char* p; p e o variabila de tipul char * (adresa de char) char *p; *p (obiectul de la adresa p) are tipul char Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointerii au adrese, ca orice variabile: pt int *p; adresa &p are tipul int ** int ** pp = &p; => pp are tipul int **, adica adresa unei adrese de int dar putem citi int* *pp sau int **pp deci *pp are tipul int * (adresa de int) si **pp are tipul int (val de la adr *pp) inainte de folosire, un pointer trebuie variabile de tipul potrivit: int x, *p, **pp; p = &x; pp = &p; O *p poate fi folosita (in cazul de mai sus, *p se foloseste absolut la fel (sinonim) cu x) int x, y, z, *p; p = &x; z=*p;  * z = x *  *p=y;  * x = у *  : Operatorii adresa & si de indirectare * sunt : *&x este chiar x, pentru orice obiect (variabila) x &*p are valoarea p, pentru orice variabila pointer p (dar p e o variabila si poate fi atribuita; &*p e o expresie si nu poate) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri Pointeri 6 Utilizarea oricarei variabile neinitializate e o eroare logica in program ! { int x; printf ("7>d", x); }   * cat e x ?? valoare la intamplare! *  , ca orice variabile i - cu adresa unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie alocata dinamic (vom discuta ulterior) : tip *p; *p = valoare; p este !! (eventual nul) => valoarea va fi scrisa la o adresa de memorie necunoscuta (evtl nula) => coruperea memoriei, rezultare eronate sau imprevizibile, terminarea fortata a programului (sub sisteme de operare cu memorie protejata) definitin stddef h ca (void *)0: nu e o adresa valida => folosit (la initializari, sau returnat) ca valoare de pointer invalid : pointerii au valori numerice, dar nu sunt acelasi lucru ca intregii => Nu convertiti intre pointer si int (e dependent de implementare) : Un prim test al corectitudinii programului: Verificati ca expresiile au tipuri corespunzatoare (ex la atribuire) => valabil si pentru pointeri (nu confundati p cu *p, etc ) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Permit prin transmiterea adresei ei - o variabila se poate modifica prin indirectarea unui pointer catre ea - nu se modifica adresa (transmisa tot prin valoare) ci continutul ei void swap (int *pa, int *pb)  * schimba val de la adr pa si pb *  { int tmp;  * variabila auxiliara necesara pentru interschimbare *  tmp = *pa; *pa = *pb; *pb = tmp;  * trei atribuiri de intregi *  }  * in functie s-a lucrat cu continutul de la adresele pa si pb *  Ex : int x = 3, у = 5; swap(&x, &y);  * acum x = 5 si у = 3 *  : Nu se poate obtine efectul cu void swap(int m, int n); (ar schimba valorile transmise in corpul functiei, fara efect in afara) Folosire: cand limbajul nu permite transmiterea prin valoare ( ) sau ar fi ineficienta (structuri mari) =t transmitem adresa variabilei Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri Pointeri in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare Declararea unui tablou aloca un bloc de memorie bt elementele sale => blocului resoectiv (= a orimului element) => oentru tabloul tip a[LEN]; numele a e o de tipul tip * fta e echivalent cu a (adresa tabloului e adresa primului element) a e echivalent cu *a (obiectul de la adresa a e primul element) Daca declaram tip *pa; putem atribui pa = a; Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu de memorie si are o adresa &pa in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s[]); sau size t strlen(char *s); (de fapt, compilatorul converteste prima varianta in a doua) size t: tip pt dimensiuni pozitive din stddef t (ca si unsigned sauunsigned long) => nu se transmit tablouri (bloc de memorie) la functii, ci adresele lor Fie char t ; Compilatorul considera ftt ca fiind t => s-ar putea scrie si scanf ("7,20s", ftt) in loc de scanf ("7,20s", t) se recomanda totusi prima varianta, pentru uniformitate cu cazul: char *p; p = s; scanf("7,20s", p)  * aici e incorect &p i *  Diferenta intre tablouri si pointeri: sizeof t == 21*(sizeof char) diferit de sizeof p == sizeof (char *) Atentie! Verificati corespondenta tipurilor in expresii Ex char m ; char *p; p si m nu au acelasi tip, dar p si m au ! Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri Pointeri 10 O variabila v de un anumit tip ocupa sizeof(tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof(tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou a + i e echivalent cu &a[i] iar *(a + i) e echivalent cu a[i] char *endptr(char *s) {  * returneaza pointer la sfarsitul lui s *  char *p = s;  * sau: char *p; p = s; *  while (*p) p++;  * adica la pozitia marcata cu A0* *  return p; } 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, l=, 0 pt sl>s2, 0 pt egal *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 11 char *strncpy(char *dest, const char *src, size t n) { char *p = dest;  * copiaza cel mult n caractere *  while (n— && *p++ = *src++); return dest; int strncmp (const char *sl, const char *s2, size t n) { if (n == 0) return 0;  * compara pe lungime cel mult n *  while (—n && *sl == *s2 && *sl) { sl++; s2++; } return *sl - *s2;  * 0 pt sl>s2, 0 pt egal *  char *strchr(const char *s, int c) {  * cauta primul c in s *  do if (*s == c) return s; while (*s++); return NULL;  * daca nu a fost gasit *  } void *memset(void *s, int c, size t n);  * seteaza n octeti cu c *  void *memcpy(void *dest, const void *src, size t n); void *memmove(void *dest, const void *src, size t n);  * copiaza n octeti; ultima varianta si pentru zone suprapuse *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 12 Fie declaratia tip a[DlMl] [DiM2]; Elementul a[i] [j] este al j-lea element din tabloul de dih2 elemente a[i] si are adresa fca[i] [j] == (tip *)(a + i) + j == (tip *)a + DiH2*i + j => pentru compilarea expresiei a[i] [j] e necesara cunoasterea lui dih2 => in declaratia unei functii cu parametri tablou trebuie precizate toate dimensiunile in afara de prima (irelevanta): void f(int m[][s]); Declaratiile char s[] = "sir"; si char *s = "sir"; sunt diferite! - prima rezerva spatiu doar pt sirul "sir", iar adresa s e o constanta - a doua rezerva spatiu si pentru pointerul s, care poate fi reatribuit char s = {"ian", "dec"}; si char *s ={"ian", "dec"}; primul e un tablou 2-D de caractere, al doilea e un tablou de pointeri Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 13 Pointeri 14 Limbajul C permite accesul la parametrii argumentele) cu care programul e rulat din linia de comanda (ex optiuni, nume de fisiere) De asemenea, permite returnarea de program a unui cod intreg (folosit uzual pentru a semnala succes sau o conditie de eroare) #include int main(int argc, char *argv[]) { int i; printf("Numele programului: %s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (i = 1; i = 1 - argv[l], etc : parametrii, asa cum au fost separati de spatii Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Adresa unei functii se poate obtine, memora, si utiliza pentru a o apela, pentru o functie tip-rez fct (tipl, , tipn); adresa are tipul tip raz (*pfct) (tipl, , tipn); se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Atentie la sintaxa: int *fct(void); declara o functie ce returneaza pointer la intreg int (*fct) (void); declara un pointer la o functie ce returneaza intreg Exemplu de utilizare: parametrizarea unei alte functii Algoritmul quicksort, declarat (in stdio h) ca functie cu parametrii: - adresa tabloului de sortat, numarul si dimensiunea elementelor - adresa functiei care compara 2 elemente (returneaza 0) efectuarea compararii depinde de tip: intreg, sir, definit de utilizator void qsortfvoid *base, size-t nun, size-t size, int ( compar)(void *, void *)); - foloseste argumente void * fiind compatibile cu pointeri la orice tip Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 15 Pointeri 16 - pentru tabele de rutine, apelate in functie de un indice - exemplu: meniu cu apelare de functii in functie de tasta apasata void help(void); void menu(void);  * *  void quit(void); void (*funtab) (void) = { help, menu, , quit }; void do cmd(void) int к = getcharO - ’0’; if (k >= 0 && к e util sa declaram un tip: typedef void (*funptr)(void);  * pointer la functie void *  funptr funtab ;  * tabloul de pointeri de functie *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pana acum am atribuit la pointeri doar adrese de variabile existente si am declarat static doar variabile de dimensiuni cunoscute la compilare Discutam: functii de gestiune dinamica a memoriei (stdlib h): alocarea memoriei dupa necesitati stabilite la rularea programului void *malloc(size t size);  * aloca size octeti *  void *calloc(size t num, size t size);  * num*size oct init 0 *   * m calloc returneaza NULL la eroare (ex mem insuficienta) *  void *realloc(void *ptr, size t size);  * modifica dimensiunea, poate muta blocul, dar pastreaza continutul memoriei *  void free(void *ptr);  * elibereaza mem alocata cu c malloc *  int i, n, *t; printf("Nr de elemente ?"); scanf("%d", &n); if ((t = malloc(n * sizeof(int)) != NULL) for (i = 0; i #include #define NUM 100  * alocam pt 100 de numere odata *  typedef int (*cmpptr)(const void *, const void *); int cmp(int *p, int *q) { return *p - *q; }•  * pt sortare *  void main(void) { int i = 0, n = 0, *t= NULL;  * contor, total, tablou *  do {  * aloca cate NUM intregi, initial si cand e nevoie *  if (i == n) •{ n += NUM; t = realloc(t, n*sizeof (int)); } scanf("%d", &t [i]);  * realloc(NULL,sz) e ca si malloc(sz) *  }• while (t [i++]); qsort(t, i, sizeof(int), (cmpptr)cmp);  * sorteaza *  for (n = 0; n programul ca datele au fost citite corect Evitati la si tablourilor (ne din citire cand am ajuns la lungimea tabloului) Depasirile de tablouri (si datele din program) si fac sistemul la printre cele mai erori Un program prost scris r , " , л fac mai mult rau decat bine Un programator ignorant Adesea un tablou trebuie umplut pana la o conditie: citire de la intrare pana la un anumit caracter (punct,  n, etc) copiere din alt sir de caractere sau tablou Trebuie sa nu scriem in tablou dincolo de lungimea lui! for (int i = 0; i int rdline(char line[], unsigned size) { —size;    pastram loc pentru ’ 0’ for (int c, i = 0; i Testam ca rezultatul e pentru a sti daca s-a citit cu succes char s ; while (fgets(s, 81, stdin)) printf ("° os", s); O linie cu > 80 de caractere va fi citita (si afisata) pe bucati Putem testa daca linia citita e incompleta (a fost trunchiata) int c; char s ; if (fgets(s, 81, stdin))    s-a citit linia if (strlen(s) == 80 && s != ’ n’    neterminata && ((c = getcharO) != EOF)   n-am atins EOF printf("linie incompleta: %s n", s); ungetc(c, stdin);    pune inapoi pe c } else printf("linie completa: %s n", s); Standardul functia : nu limita citirea puts("text urmat de linie noua"); int puts(const char *s); tipareste sirul s urmat de o linie noua  n fputs("text fara linie noua", stdout); fputs(s, stdout); e la fel ca printf ("° oS", s); tipareste sirul s ca atare, fara linie noua suplimentara stdout reprezinta (normal: ecranul) int fputs(const char *s, FiLE *stream); puts si fputs returneaza EOF la eroare, altfel un nr natural (> 0) int printf(const char* format, ); Primul parametru (format): un ; poate contine: caractere obisnuite (se tiparesc) si o litera: 7 c char, %d, %i decimal, %e, %f, %g real, %o octal, %p pointer, %s sir (cuvant), ° ou unsigned, %x heXazecimal Restul parametrilor: , ale caror se tiparesc numarul si tipul trebuie sa corespunda cu specificatorii de format Rezultatul: numarul de caractere tiparite (de obicei ignorat) Exemplu: printf("radical din %d este %f n", 3, sqrt(3)); int scanf(const char* format, ); Primul parametru: un , cu specificatori de format ca la printf, dar: e float, e double Restul parametrilor: variabilelor de citit: La siruri NU se pune &, numele sirului e chiar adresa lui variabilelor citite (atribuite) (NU valoarea!) sau EOF la eroare sau sfarsitul intrarii inainte de a citi ceva double x; float y; if (scanf ("70lf’ 0f", &x, &y) == 2) {  * ok, foloseste x, у *  } else {  * eroare: aici o tratam *  } char cuv ;} if (scanf ("7, s", cuv) == 1) {  * bine: a citit cuvantul *  } else {  * eroare: aici o tratam *  } —: scanf ( -Duce la Cel mai simplu: primitiv, dar Functia void exit(int status) din stdlib ,h termina executia Putem scrie o functie care tipareste un mesaj si apeleaza exit() Sinclude void fatal(char *msg) fputs(msg, stderr);    fisierul de eroare, normal: ecranul exit(EXiT FAiLURE);    sau exit(l): eroare Putem folosi apoi functia la fiecare citire: if (scanf ("70d", &n) != 1) fatal ("eroare la citirea lui n n");    ajuns aici: ok, folosim pe n Adesea vrem sa citim si prelucram repetat ceva Un tipar simplu: while ( ) while (fgets( )) {  * prelucreaza *  } while ((c = getcharO) != EOF) {  * prelucreaza *  } while (scanf( ) == nr var citite) {  * prelucreaza *  } La iesirea din ciclu se poate testa: EOF (sfarsit normal) sau eroare scanf se opreste cand intrarea difera de format, si NU mai citeste => inainte de a cere din nou date int m, n; printf("introduceti doua numere: "); while (scanf ("7od7od", &m, &n) != 2) { for (int c; (c = getcharO) != ’ n’;) if (c == EOF) exit(l); printf("mai incercati o data: ");    acum putem folosi m si n    cat timp nu e bine    pana la linie noua    sfarsitul intrarii Cu formatul citim un (sir de caractere fara spatii) Tabloul in care citim cuvantul are o dimensiune limitata lungimea maxima (un numar) % si s cu 1 mai putin decat lungimea tabloului, lasa loc pentru  0 char cuv ; if (scanf ("7032s", cuv) == 1) printf("Cuvantul citit: 70s n", cuv); scanf cu formatul s consuma si ignora spatiile albe initiale ( t  n  v  f  r si spatiu); adauga ’ 0’ la sfarsit Numele de tablou , NU se mai pune & Formatul citeste un (pana la spatii), Un sir din : se trec intre [ ] (intervale: cu -) Citirea se opreste la primul caracter nepermis char a ; scanf ("7,32 [A-Za-z ] ", a); max 32 litere si char num ; scanf ("7,80 " , num); sir de cifre lungimea limita intre % si [ ] Citirea unui sir la fel ca mai sus, dar " dupa [ specifica caracterele char t ; scanf ("7,80 [  n ]" , t) ; pana la sau linie noua Formatul este [ ],NUe urmat de s: 7,20 [A-Z] з Un caracter: int c = getcharO; if (c != EOF) {  * s-a citit * } sau int c; if ((c = getcharO) != EOF) {  * s-a citit * } Cu scanf (putem declara normal ca si char) char c; if (scanf ("° oc", &c) == 1) { * s-a citit * } Citirea unui char tab ; if (scanf ("7o8Oc", tab) == 1) {  * citit *  } citeste EXACT 80 de caractere, (inclusiv spatii albe) NU adauga ’ 0’ la sfarsit => nu stim daca s-au putut citi toate Verificam daca s-a ajuns la EOF initializand si testand lungimea: char tab = scanf ("708Oc", tab); int len = strlen(tab);    va fi intre 0 si 80 in format avem: specificatori cu %, sau la printf: se tiparesc; la scanf: Exemplu: citirea unei date calendaristice in format zz ll aaaa unsigned z, 1, a; if (scanf ("70u 70u 70u" , &z, &1, &a) == 3) printf("s-a citit corect: z=70u, l=7oU, a=70u n", z, 1, a); else printf("eroare la introducerea datei n"); introducem 15 4 2008 (cu puncte!) => z=15, 1=4, a=2008 scanf citeste pana cand intrarea formatului Caracterele nepotrivite nu se citesc; acele variabile nu se atribuie scanf ("7od7od", &x, &y); in: 123A ret 1; x = 123, y: necitit; ramas: A scanf ("7od7oX", &x, &y) ; in: 123A ret 2; x = 123, у = OxA (10) Formatele si consuma si ignora spatii albe initiale "%d%d" doi intregi separati si eventual precedati de spatii albe Formatele c [ ] [" ] nu ignora spatii albe (sunt caract normale) Un in format consuma oricate > 0 spatii albe din intrare scanf(" ") ; consuma spatii albe pana la primul caracter diferit "70c 7"c" citeste caracter, consuma > 0 spatii, citeste alt caracter "7"d 7"f e la fel ca "7od7"f" (spatiile sunt permise oricum) "7"d " : spatiu dupa numar consuma toate spatiile dupa ( linii noi!) Consumam spatii albe, dar nu linie noua  n: scanf("%*[ t v f r ]"); Pentru a sari peste (citi fara a folosi) date cu un format dat: Punem * dupa % si nu mai dam o adresa unde sa fie citit => scanf citeste dupa tiparul dat, dar nu pune niciunde datele si nu se numara ca variabila citita Exemplu: text care contine trei note si media, vrem doar media int media; if (scanf ("7o*d7o*d7o*d7od", femedia) == 1) {  * foloseste *  } else {  * raporteaza date in format gresit *  } Exemplu: consuma restul liniei scanf ("7o* [  n] ") ;    consuma pana la  n, fara  n if (getcharO == EOF) {  * s-a terminat intrarea *  }    altfel getcharO a citit  n, continua prelucrarea Un numar intre % si caracterul de format limiteaza caracterele citite %4d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) scanf("%d%d", &m, &n); 12 34 m=12 n=34 scanf ("7o2d7o2d", &m, &n); 12345 m=12 n=34 rest: 5 scanf ("7od o od", &m, &n); 12 34 m=12 n=34 scanf("%f", &x); 12 34 x=12 34 scanf ("%d%x", &m, &n); 123a m=123 n=0xA %d: intreg zecimal cu semn ° "i: intreg zecimal, octal (0) sau hexazecimal (Ох, OX) %o: intreg in octal, precedat sau nu de 0 ° "u: intreg zecimal fara semn %x, ° "X: intreg hexazecimal, precedat sau nu de Ох, OX %c: orice caracter; nu sare peste spatii (doar " ° "c") %s: sir de caractere, pana la primul spatiu alb Se adauga ’ 0’ ° "a, ° "A, ° "e, ° "E, %f, ° "F, ° "g, ° "G: real (posibil cu exponent) %p: pointer, in formatul tiparit de printf %n: scrie in argument (int *) nr de caractere citite pana acum nu citeste nimic; nu se numara ca si variabila citita %[•••]: sir de caractere din multimea indicata intre paranteze % ["     ]: sir de caractere exceptand multimea dintre paranteze %%: caracterul procent %d, ° "i: intreg zecimal cu semn %o: intreg in octal, fara 0 la inceput ° "u: intreg zecimal fara semn ° "x, ° "X: intreg hexazecimal, fara Ox OX; ° "x: cu a-f, ° "X: cu A-F %c: caracter %s: sir de caractere, pana la ’ 0’ sau numar dat ca precizie %f, %F: real fara exp ; implicit 6 cifre dupa precizie 0: fara punct ° "e, ° "E: real, cu exp ; implicit 6 cifre dupa precizie 0: fara punct ° "g, ° "G: real, ca %e, %E daca exp precizia; altfel ca %f Nu tipareste inutile zerouri sau punct zecimal ° "a, ° "A: real hexazecimal cu exponent zecimal de 2: Oxh hhhhp±d ° "p: pointer, uzual in hexazecimal %n: scrie in argument (int *) nr de caractere scrise pana acum %%: caracterul procent Directivele de formatare pot avea optional si alte componente: 7 fanion dimensiune precizie modificator tip : *: campul e citit, dar nu e atribuit (e ignorat) (scanf) aliniaza valoarea la stanga, la dimensiunea data (printf) +: pune + inainte de numar pozitiv de tip cu semn (printf) spatiw spatiu inainte de numar pozitiv cu semn (printf) 0: completeaza cu 0 la stanga pana la dimensiunea data (printf) hh: argumentul e char (la format diouxXn) (1 octet) char c; scanf ("7ohhd", &c);    123 -> c = 123 pe 1 octet h: argumentul este short (la format diouxXn), ex 7ohd 1: arg long (format d i o ux Xn) sau double (fmt aAeEfFgG) long n; scanf ("7old", &n); double x; scanf ("7olf", &x); 11: argumentul este long long (la format diouxXn) L: argumentul este long double (la format aAeEfFgG) : un numar intreg scanf: numarul maxim de caractere citit pentru acel argument printf: numarul minim de caractere pe care se scrie argumentul, aliniat la dreapta si completat cu spatii sau conform modificatorilor : doar in printf; punct urmat optional de un intreg (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale (la Eef)   cifre semnificative (la Gg) printf (" |° "7 2f | ", 15 234); | 15 231 2 zecimale, 7 total numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m ="ian"; printf ("° " 3s", m); (util la sir fara ’ 0’) in printf, in locul dimensiunii si sau preciziei poate apare * Atunci dimensiunea se obtine din argumentul urmator: printf ("% *s", max, s); scrie cel mult max caractere din sir Scriere de numere reale in diverse formate: printf ("7,f n", 1 0 1100); printf ("7"g n", 1 0 1100); printf ("7og n", 1 0 11000); printf ("7 e n", 1 0); printf ("7of n", 1 0); printf ("7og n", 1 0); printf ("7o 2f n", 1 009); printf ("7, 2g n", 1 009);    0 000909 : 6 pozitii zecimale    0 000909091 : 6 poz semnificative    9 09091e-05 : 6 poz semnificative    1 000000e+00 : 6 cifre zecimale    1 000000 : 6 cifre zecimale    1 : fara punct si zerouri inutile    1 01: 2 cifre zecimale    1: 2 cifre semnificative Scriere de numere intregi in forma de tabel: printf ("i7 6d|", -12); | -12| printf (" | % d| ", 12); | 121 printf ("|7o-6d| ", -12); |-12 | printf (" 17 06d | " , -12); |-000121 printf ("|7o+6d| ", 12); | +12| Scriere 20 de pozitii (printf returneaza nr de caractere scrise) int m, n, len = printf ("70d", m); printf ("° 0*d", 20-len, n); Doua caractere separate de un singur spatiu (consumat cu %*1[ ]) char cl, c2; if (scanf ("%c%*l [ 17oC", &cl, &c2) == 2) Citeste un intreg cu exact 4 cifre: unsigned ni, n2, x; if (scanf(" %n%4u%n", &nl, &x, &n2)==l && n2 - nl == 4) 7 n numara caracterele citite; stocam contor in nl, n2, apoi scadem Citeste verifica un cuvant care trebuie sa apara: int nr=0; scanf ("http:  7on", tar); if (nr == 7) {  * apare *  } else {  *nu ajunge la 7оП, nr ramane cu val 0 *  } ignora pana la (exclusiv) un caracter ( n): scanf("%* [" п]"); Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf ("7od", &n) == l),nudoarif (scanf ("7od", &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati depasirea cu extern int errno; #include    declara errno + constante pt erori if (scanf ("7od", &x) == 1))    testam resetam errno la depasire if (errno == ERANGE) { printf("numar prea mare"); errno = 0; 7 aprilie 2009 Programarea calculatoarelor Curs 7 Marius Minea Tablouri Adrese siruri de caractere 2 Tablou (vector) = o secventa de elemente de de date asociaza о (тп) cu un anumit (n) (ca un sir matematic) Declarare: tip nume-tablou[nr-elem]', double x ; int mat ; initializarea: intre acolade, cu virgule: int a = { 0, 1, 4, 9 tabloului e la care incepe memorarea elementelor tabloului (nr de elemente) = o pozitiva C99: si dimensiuni variabile, cu valoare cunoscuta in momentul declararii int f(int n) { int tab[n];  * la apelarea functiei stim n *  } : nume-tabl ] indice: orice expresie cu valoare intreaga Un element de tablou x a[i] t e folosit ca orice variabila (are o valoare, poate fi folosit in expresii, poate fi atribuit) in C, indicii de tablou incep de la ! int a ; are elemente a , a[l], a , a , a Sintaxa declaratiei: t p atd in]; sugereaza ca a[ nd ce] are tipul tip Programarea calculatoarelor Curs 7 Marius Minea Tablouri Adrese siruri de caractere #include #define MAX 100    prepro int main(void) { unsigned pEMAX] = {2};    pr unsigned cnt = 1, n = 3;    av do { for (int j = 0; n % pEjl; ++j if (p[j]*p[j] > n) { p[cnt++] = n; break;    n += 2;    } while (cnt int main(void) { double d; int a ; printf ("Adresa lui d: ° op n", &d) ;    folosim operatorul & printf ("Adresa lui a: ° op n", a);    a e adresa, nu e nevoie de & return 0; Programarea calculatoarelor Curs 7 Marius Minea Tablouri Adrese siruri de caractere 6 Declaratia unui tablou aloca si dar numele reprezinta => numele tabloului NU poarta memorie pentru elementele sale sa si nu tabloul ca tot unitar informatii despre dimensiunea lui exceptie: sizeof(numetab) La functii trebuie transmis scriem lungimea intre [] este nr-elem * sizeof (tip-elem) tabloului ( ) si sa la parametru, nu e luata in considerare #include void printtab(int t [] , unsigned len) { for (int i = 0; i un parametru tablou e transmis prin Avand adresa, functia poate accesa ( ) elementele tabloului void sumvect(double a[] , double b[], double r[], unsigned len) { for (unsigned i = 0; i void fractie(unsigned m, unsigned n) { int apare[n];    dimensiune data de parametrul n for (int i = 0; i trebuie cunoscut COL => la parametri trebuie toate dimens in afara de prima Ex: А^пх10 x Вюхб = Qmx6 void matmul(double a[] ,double b [] ,double c [] ,int lin) { for (int i = 0; i 0 dupa cum e sl fata de s2 char *strncpy(char *dest, const char *src, size t n);    copiaza cel mult n caractere din src in dest char *strncat(char *dest, const char *src, size t n);    concateneaza cel mult n caractere din src la dest int strncmp (const char *sl, const char *s2, size t n);    compara sirurile pe lungime cel mult n caractere size t: tip intreg fara semn pentru dimensiuni const: specificator de tip, indica ca obiectul respectiv nu e modificat Programarea calculatoarelor Curs 7 Marius Minea 15 noiembrie 2005 Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 2 La nivel de , ne referim la un fisier prin La nivelul , bibliotecile limbajului C definesc un tip cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF) Structura interna a tipului file: invizibila programatorului; folosim doar pointeri , prin intermediul functiilor de biblioteca Din punct de vedere logic, un fisier e un flux ( ) de octeti Fisiere (file *) standard predefinite (si deschise automat la rulare) : fisierul standard de intrare (implicit: tastatura) : fisierul standard de iesire (implicit: ecranul) : fisierul standard de eroare (implicit: ecranul) Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pentru a putea fi separate (prin redirectare) de mesajele normale de iesire operatie cu fisiere poate rezulta in eroare (din multe motive) => e testarea valoarii returnate (codului de eroare) Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 3 FiLE *fopen (const char *path, const char *mode); - arg 1: numele fisierului (absolut sau fata de directorul curent) - arg 2: modul de deschidere; primul caracter semnifica: : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, w trunchiaza la zero; a (append) adauga la sfarsit in plus, sirul de caractere pt modul de deschidere mai poate contine: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod binar (implicit: in mod text) - returneaza null in caz de eroare (trebuie testat !!!) - altfel, valoarea returnata se foloseste pt lucrul in continuare int fclose(FiLE *stream); - scrie orice a ramas in tampoanele de date, inchide fisierul - returneaza 0 in caz de succes, EOF in caz de eroare Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 4 Secventa tipica de lucru cu un fisier (ex pt citire) FiLE *fp; char *name = "f txt";  * sau din argv[], sau solicitat *  if (! (f p = fopen(name, "r"))) {  * trateaza eroarea *  } else {  * lucreaza cu fisierul *  } if (fclose(fp))  * eroare la inchidere * ; La intrarea-iesirea in mod se pot petrece diverse in functie de implementare (de exemplu traducere  n in  r n pt DOS) Datele citite corespund celor scrise doar daca: toate caracterele sunt tiparibile,  t sau  n;  n nu e precedat de spatii; ultimul caracter e  n => pentru , deschideti fisierele in mod (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc acelasi indicator de pozitie => Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 5 Cu functii echivalente celor folosite pana acum: int fputc(int c, FiLE *stream);  * scrie caracter in fisier *  int fgetc(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s);  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ 0’ la sfarsit => citirea sigura a unei linii, fara depasire Programarea calculatoarelor 2 Curs 7 Marius Minea #include void cat(FiLE *fi) { int c; while ((c = fgetc(fi)) ! int main(int argc, char *argv[]) FiLE *fp; if (argc == 1) cat(stdin);  * c else while (—argc > 0) {  * pt if (!(fp = fopen(*++argv, "r" fprintf(stderr, "can’t open else { cat(fp); fclose(fp); } return 0; Programarea calculatoarelor 2 Curs 7 б = EOF) putchar(c); } { iteste de la intrare *  fiecare argument *  ))) ° os", *argv); Marius Minea void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * != 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * != 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna cu functia char *strerror(int errnum); din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s) ;  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Programarea calculatoarelor 2 Curs 7 Marius Minea Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t runemb, FiLE *stream); size t fwrite(void *ptr, size t size, size t runemb, FiLE *stream);  * citesc scriu runemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror in C, nu exista fisiere tipizate (file of din PASCAL); putem insa defini astfel de functii pentru fiecare tip in parte: size t readint(int *pn, FiLE *stream)  * in format binar *  { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *  { return fwrite(&x, sizeof(double), 1, stream); } Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 9 #include #include #define MAX 512 int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;  * nr octeti cititi *  while (!feof(fi)) { size = fread(buf, 1, MAX, fi); fwrite(buf, 1, size, fo);  * scrie doar size *  if (ferror(fi) || ferror(fo)) return errno; return 0; Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 10 int main(int argc, char *argv[]) { FiLE *fi, *fo; if (argc != 3) { fprintf(stderr, "usage: сору source destination n"); return -1; } else { if (!(fi = fopen(argv , "r"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; return errno; if (!(fo = fopen(argv , "w"))) { f printf (stderr, "70s: can’t open ° os: ", argv , argv ); perror(NULL); return errno; if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) | fclose(fo)) perror("Eroare la inchidere"); return errno; Programarea calculatoarelor 2 Curs 7 Marius Minea Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long ftell(FiLE *stream);  * pozitia de la inceputul fisierului *  int fseek(FiLE *stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: seek set (inceput), seek cur (punctul curent), SEEK END (sfarsit) void rewind(FiLE *stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflush(FiLE *stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 12 void abortO; cauzeaza terminarea a programului; efectul pt tampoanele de date si fisierele deschise depinde de implementare int atexit(void (*func)(void)); inregistreaza functii pt apelare la terminarea normala a programului (actiuni specificate de programator, ex "doriti sa salvati fisierul ?") void exit(int status); termina normal executia programului, -intai se apeleaza functiile inregistrate cu atexit in ordine inversa - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO int system(const char *string); se executa comanda string (cu argumente) de procesorul de comenzi; daca string e null, returneaza != o daca exista procesor de comenzi Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 13 int remove(const char *filename); sterge un fisier int rename(const char *old, const char *new) ; redenumeste un fisier ambele functii returneaza o la succes si != o la eroare file *tmpf iie(void); creeaza fisier temporar, deschis in mod wb+ sters automat la sfarsit de program; de ex pt date temporare mari char *tmpnam(char *s); genereaza returneaza un nume nou de fisier numele e copiat si in s daca s e nenul (necesar: minim L tmpnam octeti) FiLE *freopen(const char * filename, const char * mode, FiLE * restrict stream); deschide fisierul filename si il asociaza cu fluxul stream (redirecteaza fluxul logic stream in fisierul fizic filename; returneaza null in caz de eroare, stream la succes inchide un eventual fisier asociat anterior cu stream) poate fi folosit pentru redirectarea intrarii iesirii din program Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 14 #include #include int fatal(char *msg) { perror(msg); exit(l); } int main(int arge, char **argv) char s ; if (arge != 2) fatal("lipseste nume fisier"); if (!freopen(argv , "r", stdin)) fatalC'eroare la deschidere redirectare intrare"); if (!freopen(tmpnam(NULL), "w+", stdout)) fatalC'eroare la creare redirectare iesire"); if (systemC'sort")) fatalC'eroare la sortare"); if (fseek(stdout, 0, SEEK SET)) fatalC'eroare repozitionare");  * prelucram fisierul de iesire; aici doar tiparim *  while (fgets(s, 80, stdout)) fprintf (stderr, "° os", s) ; felose(stdin); felose(stdout); return 0; Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 15 Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, int sscanf(const char *s, const char *format, Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf (s, "° od", &n) ;  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu ° on) *  Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 16 Functiile de tipul printf scanf au numar variabil de argumente ( ) Pentru a implementa o astfel de functie, trebuie un mod de acces la argumentele cu numar variabil, pornind de la ultimul arg numit => limbajul C defineste o serie de macro-uri in stdarg h - tipul va iist pentru a retine informatii despre lista de argumente void va start(va list ap, ultimarg); - initializeaza ap pornind de la adresa ultimului argument tip va arg(va list ap, tip); - returneaza urmatorul argument din lista, presupus a fi de tipul tip apelata repetat pentru fiecare argument; tipul argumentelor si numarul lor trebuie deduse din argumentele fixe (ex formatul la print scanf) void va copy(va list dest, va list src); - copiaza un va list, inclusiv punctul curent de prelucrare atins void va end(va list ap); - apelat pentru incheierea corecta a prelucrarii argumentelor Programarea calculatoarelor 2 Curs 7 Marius Minea - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie #include sau #include "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) #define LEN 20  * substitutie textuala simpla *  int tab[LEN];  * pentru definirea de constante simbolice *  for (i = 0; i (В) ? (A) : (B)) #define swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } Obs: substitutia se face textual => pot aparea probleme subtile - folositi paranteze in jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere 18 pt a compila selectiv portiuni de cod din program in functie de optiuni (caracteristici arhitecturale; pt depanare; functionalitate in plus; etc) Sintaxa: grup-cod ::= test-if grup-cod grupuri-elifOpt grup-elseopt #endif test-if ::= #if expr-const | #ifdef identificator | #ifndef identificator grup-elif ::= #elif expr-const grup-cod (toate # apar grup-else ::= #else grup-cod pe linie noua) expr-const ::= cele obisnuite | #define DEBUG  * daca depanam *   * cod obisnuit *  #ifdef DEBUG printf("am ajuns aici, x = "); #endif  * alt cod obisnuit *  identificatori predefiniti: FiL defined identificator #if defined GNUC  * compilator GNU *  #if GNUC == 2  * versiunea 2 *   * cod specific pt versiune *  #else  * alta versiune *   * cod specific pt alta versiune *  #endif #endif ; LiNE DATE TiME Ex: fprintf (stderr, "eroare in ° os linia ° od n" , FiLE , LiNE ); Programarea calculatoarelor 2 Curs 7 Marius Minea 23 noiembrie 2004 Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire int isalnum(int c) (isalpha(c) || int isalpha(int с) (’A’ a int toupper(int c)  * a - z -> A Utilizarea si programarea calculatoarelor Curs 7 2 isdigit(с)) ) control, valoare: 0 - 31 *  ) paribil, exceptand spatiu *  caracterele introduse sunt stocate temporar in tamponul de intrare apoi sunt preluate rand pe rand, la executia citirilor din program (chiar daca programul citeste un numar, utilizatorul poate introduce mai multe; restul vor fi citite ulterior) scanf ("° od", &x) ; scanf ("° od", &y) ; si scanf ("7od7od" , &x, &y) ; au acelasi efect (pentru int x, y;) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 4 in aceste functii, caracterele apar ca si unsigned char convertite la int fie valoare 0 255, fie EOF = sfarsit de fisier (definit ca -1) EOF introdus de la tastatura: Ctrl-D (UNiX) sau Ctrl-Z (DOS) int getchar(void);  * citeste un caracter de la intrare *  returneaza caracterul citit sau EOF Nu folositi char c = getcharO; Nu se poate compara cu EOF ! int putchar(int c);  * tipareste un caracter la iesire *  returneaza caracterul tiparit, sau EOF in caz de eroare Citirea scrierea caracter cu caracter si cea formatata pot fi amestecate liber in program; fiecare continua de unde s-a oprit precedenta NU sunt Standard C: conio h, getchO, getcheO, clrscrO => nu folositi pentru operatiunile de intrare iesire uzuale !!! Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 5 Eliminarea comentariilor dintr-un program C citit de la intrare #include int main(void) int c; while ((c=getcharO) != EOF) if (c != ’ O putchar(c);  * in afara comentariului *  else if ((c = getcharO) == ’*’)  * incepe comentariul *  do { while (getcharO != while ((c = getcharO) == ’*’);  * posibila iesire *  } while (c != ’ O;  * iese daca a aparut ’ ’ dupa }*} *  else { putcharO O; putchar(c) ; }  * fara *  Obs: presupune ca nu apare EOF in comentariu (se blocheaza altfel!) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 6 int printf(const char* format,  * tiparire formatata *  restul parametrilor: de tiparit (orice ) returneaza: numarul de caractere tiparite int scanf(const char* format,  * citire formatata *  restul parametrilor: variabilelor de citit returneaza: numarul variabilelor citite (atribuite), sau EOF daca apare o eroare de intrare inainte de citirea primei variabile sirul de formatare are o structura similara pentru printf si scanf Poate contine caractere arbitrare pe langa directivele de formatare (se tiparesc pt printf; trebuie sa apara in intrare pt scanf) Tipul argumentelor trebuie sa corespunda precis tipurilor specificate in format (pentru printf, la nevoie, folosind conversii explicite) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 7 — citeste conform tiparului pana cand datele de intrare nu corespund (fie cu caracterele obisnuite solicitate, fie cu formatul: ° od 7of etc ) Restul variabilelor raman neatribuite, iar caracterele necitite raman in tamponul de intrare Exemplu: scanf("test"); intrare: text n => citeste te iar xt n ramane in intrare pentru urmatoarea citire => trebuie testata valoarea returnata pentru a sti ca s-a citit corect => evtl trebuie consumata intrarea inainte de a solicita din nou date int m, n; printf("introduceti doua numere: "); while (scanf ("7odo od", &m, &n) != 2) {  * amandoua corect ? *  while (getcharO != ’ n’);  * nu? consuma restul liniei *  printf("mai incercati o data: "); }  * acum putem folosi m si n *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 8 - spatiile albe (vezi isspaceO) din intrare: separatori impliciti; se ignora inainte de formate numerice si sir ° os (nu la caracter ° oc) => formatele "o odo of" si " 7od 7of" etc sunt echivalente - orice spatiu alb din format consuma toate spatiile albe din intrare (daca exista) pana la urmatorul caracter care nu e spatiu alb NU puneti spatii la sfarsitul formatului: "° od n" "° oc " "° of " etc obliga introducerea unui caracter diferit de spatiu alb (nu e consumat) - orice alte caractere din format trebuie sa corespunda exact in intrare - un numar intre ° 0 si caracterul de format limiteaza caracterele citite ° 04d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) Format scanf scanf ("7odo od" , &m, &n) ; scanf ("7o2d7o2d" , &m, &n) ; scanf ("7od 70d" , &m, &n) ; scanf("7of", &x) ; scanf ("7od7oX" , &m, &n) ; intrare Rezultat 12 34 12 34 12345 12 34 12 34 12 34 12 34 12 34 123a 123 1 OxA Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 9 La citirea datelor de intrare: utilizatorul poate introduce ORiCE ! => trebuie sa ne protejam de date (ne)intentionat eronate Utilizatorul poate introduce mai multe caractere decat memoria alocata => corupe memoria, termina programul, probleme de securitate ! Pentru o citire corecta si sigura, folositi limitari in scanf Citirea unui caracter: char c;scanf ("° oc", &c); Testati rezultatul (EOF!) Citirea mai multor caractere: intr-un tablou (sir), in limitele acestuia: — un : char s ; scanf ("° 080c" , s) ; orice caractere, inclusiv spatii albe; nu se adauga automat ’ 0’ - un (orice pana la spatiu alb) char s ; scanf ("° 079s", s); ignora spatii albe initiale; adauga ’ 0’ la sfarsit — O , pana la ’ n’ char s ; fgets(s, 80, stdin); citeste max 80-1 caractere, inclusiv Лп’, adauga ’ 0’ stdin: identificator definit in stdio h pt fisierul standard de intrare Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 10 Se poate limita citirea la caractere dintr-o multime: specificatorul ° 0[ ] -intre [ si ] se trec caracterele admise (cu - pentru intervale) Exemplu: "° 032 [A-Za-z]" pentru maxim 32 de litere mari sau mici - sau cu   dupa [ se precizeaza caracterele nepermise Exemplu: "° o8O " pentru maxim 80 de caractere, nu semne de punctuatie char id ; scanf ("° ol [A-Z a-z] ° 031 " , id, &id[l]); citeste un identificator de max 32 de caractere, adauga automat ’ 0’ char s ; scanf ("° o8O [  n] ° 0*l [ n]", s); citeste o linie de max 80 caractere, si ignora (vezi modificatorul *) caracterul ’ n’ de la sfarsit, dar esueaza cu ’ n’ necitit daca se da o linie goala => e preferabil fgets Cu specificatorul ° on se stocheaza intr-o variabila intreaga numarul caracterelor citite de la intrare => se pot face anumite verificari char s ; int n; if (scanf ( "° o8O [  n] ° on" , s, &n) == 1) printf ("Linia are lungimea ° od n" , n) ; Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 11 ° od: intreg zecimal cu semn 7oi: intreg zecimal, octal (0) sau hexazecimal (Ox, ox) ° oo: intreg in octal, precedat sau nu de 0 ° ou: intreg zecimal fara semn ° oX, ° oX: intreg hexazecimal, precedat sau nu de Ox, ox ° oc: orice caracter; nu sare peste spatii (doar " ° oc") ° os: sir de caractere, pana la primul spatiu alb Se adauga ’ 0’ ° oa, ХА, ° oe, ХЕ, ° of, ° 0F, ° og, ° 0G: real (posibil cu exponent) ° op: pointer, in formatul tiparit de printf ° on: scrie in argument (int *) nr de caractere citite pana in prezent; nu citeste nimic; nu incrementeaza nr de campuri convertite atribuite %[•••]: sir de caractere din multimea indicata intre paranteze • •]: sir de caractere exceptand multimea indicata intre paranteze ’ o’Z: caracterul procent Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 12 7"d, 70i: intreg zecimal cu semn 7"o: intreg in octal, fara 0 la inceput 7ou: intreg zecimal fara semn 7 x, 7 x: intreg hexazecimal, fara 0x 0X; cu a-f pt 7 x, A-F pt 7 x 7"c: caracter 7"s: sir de caractere, pana la ’ O’ sau nr de caractere dat ca precizie 7"f, 7"F: real fara exp ; precizie implicita 6 poz ; la precizie O: fara punct 7"e, 7"E: real, cu exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7"g, 7 G: real, ca 7"e, 7 E daca exp precizia; altfel ca 7"f Nu tipareste zerouri sau punct zecimal in mod inutil 7"a, 7 A: real hexazecimal cu exponent zecimal de 2: Ox i hhhhp±d 70p: pointer, in format dependent de implementare (tipic: hexazecimal) 7oii: scrie in argument (int *) nr de caractere scrise pana in prezent; 7 7 : caracterul procent Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 13 Directivele de formatare pot avea optional si alte componente: % fanion dimensiune precizie modificator tip : doar pentru printf, cu exceptia lui * (doar scanf) *: scanf: campul este citit, dar nu e atribuit (e ignorat) -: aliniaza valoarea la stanga intr-un camp de dimensiune data +: pune + inainte de numar pozitiv de tip cu semn spatiu', pune spatiu inainte de numar pozitiv de tip cu semn #: format alternativ (0X 0x 0 pt hex octal, alte zecimale pt reali) 0: completeaza cu 0 la stanga pana la dimensiunea data hh: argumentul este char (pt diouxXn) h: argumentul este short (pt diouxXn) 1: argumentul este long (pt diouxXn) sau double (pt aAeEfFgG) 11: argumentul este long long (pt diouxXn) L: argumentul este long double (pt aAeEfFgG) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 14 : un numar intreg scanf: numarul maxim de caractere citit pentru argumentul respectiv printf: numarul minim de caractere pe care se scrie argumentul (aliniat la dreapta si completat cu spatii, sau conform modificatorilor) : doar in printf; punct urmat de un numar intreg optional (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale pentru Eef numarul de cifre semnificative pentru Gg numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m ="ian"; printf ("° 0 3s" , m) ; (util pt sir neterminat in ’ 0’) in printf, in locul dimensiunii si sau preciziei poate apare *, caz in care valoarea se obtine din argumentul urmator Exemplu: printf ("° o *s" , max, s) ;  * scrie cel mult max caractere din s *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 15 Scriere de numere reale in diverse formate: printf ("° of n", 1 0 1100);  * 0 000909 : 6 poz zecimale *  printf ("° og n", 1 0 1100);  * 0 000909091 : 6 poz semnificative *  printf ("° og n", 1 0 11000);  * 9 09091e-05 : 6 poz semnificative *  printf ("° oe n", 1 0);  * 1 000000e+00 : 6 cifre zecimale *  printf ("° of n", 1 0);  * 1 000000 : 6 cifre zecimale *  printf ("° og n", 1 0);  * 1 : fara punct zecimal, zerouri inutile *  printf ("° o 2f n", 1 009);  * 1 01: 2 cifre zecimale *  printf ("° o 2g n", 1 009);  * 1: 2 cifre semnificative *  Scriere de numere intregi in forma de tabel: printf (" | ° o6d | " , -12);  * 1 -121 * printf (" | ° o"6d | " , -12);  * 1-12 i * printf (" | ° o+6d | " , 12);  * 1 +121 * printf(" Г  d|", 12);  * 1 121 * printf (" | ° oO6d | " , -12);  * 1-000121 * Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 16 - ora si minute separate cu : intre ele unsigned h, m; if (scanf ("° ou: ° ou", &h, &m) == 2) {  * etc *  } - doua caractere separate de un singur spatiu char cl, c2; if (scanf ("70c70*l [ ]7oC", &cl, &c2) == 2) { * etc * } - citirea unui intreg cu nr fix de cifre (ex 4): unsigned nl, n2, x; if (scanf (" 7оп7о4и7оп", &nl, &x, &n2) == 1 && n2 - nl == 4)  * etc *  - eliminarea spatiilor: scanf (" "); - ignorarea pana la un caracter dat, ex virgula: scanf ("7o*[ ,]; Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf ("7od" , &n) == 1) si nu doar if (scanf ("7od" , &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati si depasirea, folosind extern int errno; #include if (scanf ("7od", &x) == 1)) if (errno == ERANGE) { printf("numar prea mare"); errno = 0; }  * errno trebuie resetat dupa eroare *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Functii de intrare iesire 17 Normal, intr-un program: citirea de la tastatura, tiparirea pe ecran Folosirea functiilor standard din stdio h permite automat intrarii si a iesirii = efectuarea lor (d)in alt loc, precizat la rulare Exemplu: pe linia de comanda prog fisier progl i prog2 citirea (intrarea) lui prog se face din fisier tiparirea (iesirea) lui prog se face in fisier iesirea lui progl se transmite direct la prog2 Exemplu: copiere pe caractere de la intrare la iesire pana la EOF #include void main(void) int c; while ((c = getcharO) != EOF) putchar(c) ; Se pot copia doua fisiere: nume-program fisier-dest Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Verificare formala Curs 7 noiembrie 2004 Marius Minea Reducerea spatiului starilor 2 Abstractia: esentiala pentru verificarea sistemelor realiste • implica construirea unui sistem (cu mai putine detalii) • si stabilirea unei intre proprietatile sistemului abstract si cele ale sistemului original - abstractii exacte: pastreaza valoarea de adevar - abstractii conservatoare (aproximative): corectitudinea sistemului abstract implica cea a sistemului real, dar nu invers (contraexemplu in sistemul abstract poate sa nu existe in cel real) Modelul abstract: obtinut fara a-l construi pe cel concret (construirea modelului concret e adesea imposibila practic, fiind prea mare) - tehnici de abstractie sintactice - sau semantice (ex domeniu redus pentru variabile) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 3 Automate temporizate: graful regiunilor, automatul zonelor - sunt abstractii finite ale unui sistem infinit - la mai multe stari din sistemul concret (locatie, atribuire de ceasuri) corespunde o stare in sistemul abstract O e de regula o - tabloul pentru o formula LTL verifica a implementarii e o abstractie pt sistemul care o Relatiile de (incluziune a limbajelor, simulare) intre un sistem concret si unul mai abstract Folosirea pachetelor de 1 bit in modelarea protocolului de la proiectul 1 Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 4 Abstractie prin eliminarea variabilelor care nu afecteaza specificatia Fie un sistem M cu multimea de variabile V = {t?i, • • •, vn} descris prin ecuatiile v^ = Л(Ю- Fie Vf multimea variabilelor referite in specificatie Conul de influenta al lui Vf = multimea minimala C CV a i -Vf CC - daca vi e C, si fi depinde de Vj, atunci Vj e C (inchidere tranzitiva) Construim un nou sistem Mf eliminand toate variabilele (si ecuatiile lor functionale) care nu apar in C Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 5 Demonstram ca metoda conului de influenta pastreaza valoarea de adevar a specificatiilor CTL* (definite peste variabilele din O) Concret, fie V = {vi,v2,     vn] o multime de variabile boolene si M = (S, Sq, R, L'), cu: - S = {0, l}n = multimea atribuirilor la V; Sq C S - R = Л?=іН = Л(Я) - L(s) = = 1} (variabilele egale cu 1 in s) Fie V numerotata a i C = {vi,      , vk} Definim M'= (S', Sq, Я', L'): - S' = {0, l}fc = multimea atribuirilor la C - Sq = {(d'i, •   •, dp|S(di, •   • dn) E Sq cu d  = di Л Л d'k = dk} -R' = Kki=i^'i = Л(с)) - L'(s) = {v^s'tvi) = 1} Se arata ca modelul concret M si cel abstract Mf sunt bisimilare Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 6 Notiune similara dar mai generala, pt programe [Weiser’79] - inspirata din operatiunile mentale facute la depanare = calculul fragmentului de program care poate afecta valorile calculate intr-un anumit punct de interes (ex nume variabila + linie sursa) - de regula: fragment executabil, in limbajul sursa - metoda bazata pe notiunile de dependenta de control si de date Diverse tipuri de slicing: - static sau dinamic - criterii sintactice sau semantice - traversare inainte sau inapoi a grafului de control - tipul de dependente considerat: date control; directe tranzitive - pe toate sau unele din drumurile prin graful de control Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 7 — folosita pentru a rationa despre circuite cu numar mare de biti sau pentru programe cu structuri de date complexe - utila in cazul in care operatiile de prelucrare a datelor in sistem sunt relativ simple (transfer, nr mic de operatii logice aritmetice) ideea: stabilirea unei corespondente intre domeniul original al datelor si un domeniu de dimensiune mai mica (ex cu doar cateva valori) Exemplu: abstractia semn (- daca x 0 unde T = 0, +} => nu intotdeauna putem avea abstractie precisa => domeniul si functia de abstractie: alegere dificila, judicioasa Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 8 - pt orice variabila x, definim o variabila abstracta x - etichetarea starilor cu propozitii atomice indicand valoarea abstracta (pt abstractia semn: 3 propozitii p , p , p% pt fiecare variabila x, indicand x = " — ", x = 0, x = " + ") - comasarea tuturor starilor cu aceleasi etichete abstracte => spatiul abstract al starilor: 2AP, AP = propozitiile abstracte Pentru un model M reprezentat explicit, definim modelul abstract (redus) Mr = (Sr, Rr, Lr): - Sr = {Lr(s) | s e S} = etichetarile (abstracte) ale starilor din S - = {"o e Sr | 3sq e S° Lr(sQ) = (etichetarile starilor initiale) - Rr(sr,tr) din ^(жі, • • •, xn) obtinem 0(fi, • • •, xn) in variabile abstracte Transformarea ф ф: operatie complexa => o aplicam (ca si negatia) doar la relatii elementare intre variabile (ex =, , etc ) Definim prin inductie structurala o abstractie cu aproximare Л: - Л(Р(жі, , xn)) = F(^i, • • •, xn), daca P este relatie elementara - Л(->Р(жі, , xn)) = ^P(^i, • • •, xn) - А(фі л ф2) = Л(Фі) л А(ф2)   А(фі ѵ ф2) = Л(фі) ѵ А(ф2) - А(Эхф) = Эх А(ф) — А(Ухф) =  7хА(ф) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 11 Cu definitiile anterioare, se demonstreaza ca Vo Л( ) in particular, So => Л( F(di, • • •, dn) = P(dp • • •, d^) atunci M   Ma (modelul abstract e bisimilar celui original) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 12 O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] Consta in: - un domeniu concret D si un domeniu abstract A, legate printr-o conexiune Galois  - o functie de abstractie a : D A — o functie de concretizare 7 : (asociaza fiecarei valori abstracte o multime de valori concrete) — a i   x G x С 7(а(ж)) si Va G A a = 0(7 (a)) (abstractizarea urmata de concretizare introduce aproximare; concretizarea urmata de abstractizare e exacta) Majoritatea abstractiilor pot fi reformulate in acest cadru general Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 13 Pentru circuite programe aritmetice: abstractia definita de h(x) = x mod n, n 6 Z Pastreaza relatiile primitive aritmetice, pentru ca (( t mod n) + (y mod n)) mod n = (ж + у) mod n, etc in plus (ierna chineza a resturilor): daca relativ prime, si n = ni • П2 • • n^, atunci x = у (mod n) o A^=i x = У (mod n^) => pentru a verifica un sistem cu aritmetica pe 16 biti, e suficienta verificarea pentru intregi modulo 5, 7, 9, 11, 32 (produs > 216) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 14 Pentru verificarea cailor de date ale unui sistem (functia principala: calculul si transmiterea unor valori) Exemplu: transmiterea corecta din a in b initial: pt valoare fixa: Functia de abstractie: AG(a = 17 AX6 = 17) ,   x   1 daca x = 17 — i 0 in caz contrar Mai general: introducem parametrul simbolic c: daca x = c in caz contrar => relatie de tranzitie abstracta R(a, af,b, bf, c) intr-o reprezentare cu BDD-uri, c practic nu creste complexitatea daca comportamentul sistemului e independent de c Exemplu: sumator cu pipeline pe doua cicluri: AG(regl = а Л reg2 = b AX AX sura = a b) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 15 Spatiul starilor unui sistem = produsul componentelor: S = S± x x Sn => exponential in numarul componentelor, adesea imposibil de construit Daca specificatiile sunt automate: pot "ghida" algoritmul de verificare, construind doar portiunile necesare ale spatiului starilor Se construieste doar automatul S din negatia specificatiei Din starea s = (r, q) cu r e A si q e S: - se considera doar acei succesori ai lui r cu tranzitii etichetate la fel ca tranzitiile din q (din specificatie) - la gasirea unui (contra)exemplu, explorarea se incheie inainte de a fi explorat intreg spatiul starilor Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 16 ideea de baza: construirea unui model redus = spatiul de stari si traiectoriile sunt submultime ale celor originale Justificarea: traiectoriile excluse nu aduc un plus de informatie - relatie de echivalenta intre traiectorii - specificatia nu poate distinge intre traiectorii echivalente - modelul redus contine un reprezentant din fiecare clasa Denumirea: initial, bazata pe ordonarea partiala a tranzitiilor Mai generic: model checking cu reprezentanti Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 17 (go-nj so) Ol 03 02 ordonare arbitrara a evenimentelor concurente => n tranzitii genereaza n  ordonari si 2n stari => "explozie" combinatoriala (exponentiala) a spatiului starilor Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 18 Modelul: sistem de stari-tranzitii Sq,L) O tranzitie a e T e o submultime a C S x S (privita ca o familie de tranzitii elementare etichetate la fel) Tranzitie activata in s: а e enabled^s) оЗУ e S a(s,sf) Consideram doar tranzitii deterministe: Va,s 3!s' a(s,sfy) - sistemul insa poate fi nedeterminist, daca  enabled{s)  > 1 : doua conditii, Vs e S: Activare: a, 3e enabled^s) => o 6 enadZed( 3(s)) Л (3 G enabled(a(sy) - doua tranzitii independente nu se pot dezactiva reciproc - dar una o poate activa pe cealalta Comutativitate: a^e enabled(s) => o( 3(s)) =  3(o(s)) - efectul executiei e acelasi independent de ordine Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 19 (in raport cu APf C AP) aET invizibila o Vs, sf ES,sf= a(s) => L(s) П AP' = L(s') П AP' (nu schimba etichetarea cu propozitii din APf) in practica: APf = propozitiile atomice din specificatie P РЛ РЛ Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 20 in compozitia asincrona, operatorul X nu este relevant: - doua tranzitii in componente diferite pot fi ordonate arbitrar - doua tranzitii in aceeasi componenta pot fi separate de tranzitii in alte componente => starea locala in componenta ramane aceeasi Doua traiectorii infinite тг = si ttz = rgri sunt echivalente la repetitie (stuttering equivalent), тг  st daca pot fi divizate in blocuri finite de stari identic etichetate: 3 sirurile infinite 0 = zq 0 L(sifc) = L(sifc+1) = L(sifc+1 i) = L(rJfc) = L(rJfc+1) = L(rJfc+1 i) O formula LTL Af este invarianta la repetitie (stuttering invariant) daca Ѵтг, 7rz cu тг  st , тг у о тг7 у Teorema: Orice formula in LTL V (fara operatorul X) este o proprietate invarianta la repetitie, si reciproc Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 21 Modelul redus e construit selectand din fiecare stare doar o submultime de tranzitii din cele activate in acea stare Selectia se face pastrand pentru fiecare cale din modelul original M o cale repetitiv echivalenta in modelul redus Mf => VAf e LTL x M |= Af O Mf |= Af Diverse criterii de selectie si denumiri: stubborn sets [Valmari], persistent sets [Godefroid]; utilizam ample sets [Peled] Selectia tranzitiilor: descrisa printr-un set de conditii: СО: amplele) = 0 O enabled(s') = 0 Succesor in modelul original => exista un succesor in modelul redus Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 22 Ci O traiectorie din s nu poate executa o tranzitie dependenta de o tranzitie din ample^s) inainte de a fi executat o tranzitie din ample^s) Proprietate: Tranzitiile din ample^s) sunt independente de cele din enabled^s)   ample(s') => orice traiectorie dintr-o stare s are una din formele: - un prefix аі"2 • • • an 3, unde  3 e ampZe(s), si oz independente de  3 - un sir infinit "оа1 • • •, cu independente de orice  3 e ample(s') 5Q o^ 0'2 52 On O^L O2 r2 r 1 n C2 (invizibiiitate) ample(s') ф enabled(s') => ample(s') C invisible(s') Daca s nu e explorat complet, tranzitiile din ample(s') sunt invizibile Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 23 C3 O tranzitie activata in toate starile unui ciclu trebuie inclusa in ample(s') pentru o stare s din ciclu [3 (3 0'2 Ol 03  3  3 - garanteaza ca nu sunt ignorate portiuni din spatiul starilor datorita ignorarii persistente a unei tranzitii - implementare: in orice ciclu, o stare e explorata complet Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 24 Pt traiectoria тг din s, construim una echivalenta тг'in modelul redus: a) daca urmatoarea tranzitie e in ample(s), o adaugam la тг' b) urmatoarea tranzitie din тг nu ein ample^s) => cf C2 tranzitiile din amplele) sunt invizibile (3 tranzitii 0 ampZe(s)) Ы) daca in тг mai urmeaza o tranzitie (3 e amplele), se adauga la тг' - cf Ci,  3 e independenta de tranzitiile precedente - e invizibila, deci comutareea nu afecteaza specificatia b2) nu exista tranzitii din ample(s) in тг => se adauga tranzitie arbitrara (3 e amplele) la тг' - cf Ci nu dezactiveaza tranzitiile urmatoare - e invizibila => nu afecteaza specificatia - cf C3 acest caz apare in numar finit Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 25 Conditiile nu se pot verifica direct => euristici conservatoare - Tranzitii care citesc si scriu o variabila comuna sunt dependente - Alegeri conditionale in acelasi proces sunt dependente - Tranzitiile de comunicatie intra in dependentele ambelor procese - Operatiuni de transmitere pe acelasi buffer sunt dependente La fel, pt operatiuni de receptie Tranzitii cu multimi disjuncte de procese sunt independente => selecteza o multime P de procese care in starea curenta nu au operatii de comunicatie cu procese din afara lui P => ample(s') = tranzitiile activate din P ideal: putine tranzitii in ample(s) (ex tranzitie locala intr-un proces) Verificare formala Curs 7 Marius Minea Reducerea spatiului starilor 26 implementarea directa a conditiilor: reprezentare explicita a starilor - C3 e cel mai usor de verificat intr-o explorare DFS Obs: C2 si C3 limiteaza potentialul de reducere => pot fi combinate: C2’: Daca amplele) ПТ* 7^ 0, se explorat complet, unde T*: - contine toate tranzitiile vizibile - orice ciclu din modelul redus contine o tranzitie din T* Determinarea unei multimi T* se poate face static => reducerea enabled ample inclusa in model (precompilare) => nu necesita modificarea algoritmilor de verificare => combinatie: reducere cu ordonare partiala + explorare simbolica => eficienta pentru sisteme mixte hardware software Verificare formala Curs 7 Marius Minea 15 noiembrie 2010 Limbaje de programare Curs 6 Marius Minea Tablouri Adrese siruri de caractere 2 Tablou (vector) = un sir de elemente de de date Tabloul x asociaza la un n, o in matematica, acelasi lucru face un т(п) double x ; int mat ; intre acolade, cu virgule: int a = { 0, 1, 4, 9 tabloului (nr de elemente) = o pozitiva C99 accepta si dimensiuni variabile, cu valoare cunoscuta in momentul declararii void f(int n) { int tab[n];  * n e cunoscut in momentul apelului *  } Sintaxa declaratiei: tip a[d m]; sugereaza ca a[ nd ce] are tipul tip Limbaje de programare Curs 6 Marius Minea Tablouri Adrese siruri de caractere 3 Un de tablou nume-tabloul ] e folosit ca orice are o valoare, poate fi folosit in expresii, poate fi atribuit x = 1; n = a[i] ; t [i] = t [i + 1] poate fi orice cu valoare in C, indicii de tablou sunt de la la dimensiune - 1 int a ; are elemente a , a[l], a , a , a Exemplu de traversare si atribuire a unui tablou: int a ; for (int i = 0; i evitam greselile din neatentie sau uitare Limbaje de programare Curs 6 Marius Minea Tablouri Adrese siruri de caractere #include #define MAX 100    prepro int main(void) { unsigned pEMAX] = {2};    pr unsigned cnt = 1, n = 3;    av do { for (int j = 0; n % pEjl; ++j if (p[j]*p[j] > n) { p[cnt++] = n; break;    n += 2;    } while (cnt int main(void) { double d; int a ; printf ("Adresa lui d: ° op n", &d) ;    folosim operatorul & printf ("Adresa lui a: ° op n", a);    a e adresa, nu e nevoie de & return 0; Limbaje de programare Curs 6 Marius Minea Tablouri Adrese siruri de caractere 9 Declaratia unui tablou aloca si dar numele reprezinta => numele tabloului NU poarta memorie pentru elementele sale sa si nu tabloul ca tot unitar informatii despre dimensiunea lui exceptie: sizeof(numetab) La functii trebuie transmis scriem lungimea intre [] este nr-elem * sizeof (tip-elem) tabloului ( ) si sa la parametru, nu e luata in considerare #include void printtab(int t [] , unsigned len) { for (int i = 0; i un parametru tablou e transmis prin Avand adresa, functia poate accesa ( ) elementele tabloului void sumvect(double a[] , double b[], double r[], unsigned len) { for (unsigned i = 0; i void fractie(unsigned m, unsigned n) { int apare[n];    dimensiune data de parametrul n for (int i = 0; i trebuie cunoscut COL => la parametri trebuie toate dimens in afara de prima Ex: А^пх10 x Вюхб = Qmx6 void matmul(double a[] ,double b [] ,double c [] ,int lin) { for (int i = 0; i 0 dupa cum e sl fata de s2 char *strncpy(char *dest, const char *src, size t n);    copiaza cel mult n caractere din src in dest char *strncat(char *dest, const char *src, size t n);    concateneaza cel mult n caractere din src la dest int strncmp (const char *sl, const char *s2, size t n);    compara sirurile pe lungime cel mult n caractere size t: tip intreg fara semn pentru dimensiuni const: specificator de tip, indica ca obiectul respectiv nu e modificat Limbaje de programare Curs 6 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  7 noiembrie 2016 Unde folosim formule prepozitionale ? in , construit din in formule mici (simple), in formule mari, in probleme de Ce inseamna o si aplicatiile ei logica? , etc si Calculatoarele sunt construite din => realizeaza aceleasi ca in logica (sl, SAU, NU) sunt reprezentate in calculator => valori   biti: (0 sau 1, F sau T) pe numere e implementata prin circuite logice add( a, b) { b ? add(a b, (a&b) 2 sau schimbul 1 4, sau Un lant de mutari are o mutare (tranzitie) intre fiecare stare si cea urmatoare Numerotam vectorii pentru fiecare stare v°, v1, vk  R(v°, v1) A R(v  v2) A A R(vk 1, vk) O si un se pot reprezenta ca formule logice Prima mutare: R(y°, v1) = (p° = О V p° = 0) A p1 = p° A p1 = p° Л РІ = pj A Л Pg = Pg V(p° = 0 V p° = 0) Л p1 = p° Л p1 = p° Л P2 = p° A A Pg = Pg V(p° = 0 V p° = 0) Л p1 = p° Л p1 = p° Л p| = p° A A p) = ps e tot o formula peste elementele vectorului de stare v: Sf(v) = рі = 1  р2 = 2     р7 = 7  рв = 8  рд = 0 Exista o in к pasi daca si numai daca S0(v°) A R(v°, v1) A Rtv1, v2) A A R^-1, vk) Л Sf(yk) Fie So(v) si Sf(v) formulele ce exprima starile initiale si finale A ajunge din Sq in Sf in o e realizabila formula S0(v°) (iz0 e o stare initiala si iz1 o stare finala si e o tranzitie intre ele) A ajunge la Sf din Sq in o e realizabila formula So(iz0) A R(v°, iz1) A A R^-1, vk) A Sf(vk) => Gasim un cautand succesiv solutii pentru formule tot mai complexe: 1, 2, 3, pasi Exista si alti algoritmi dedicati planificarii Aici am redus problema la o exprimare , fundamentala: (problema SAT) Se da o formula in Exista vreo atribuire de valori de adevar care o face adevarata ? = e (engl ) formula ? (а V V —’d) Л (-іа V -i ?) Л (-іа V с V -id) A (- a V - c) a trebuie sa fie T in (а V b) A -ib Л (->a V -if? V c) b trebuie sa fie F R2a) Daca un literal e T, in care apare (ele sunt adevarate, si nu mai influenteaza formula) R2b) Daca un literal e F, din clauzele in care apare (nu ajuta in a face clauza adevarata) Exemplele de mai sus se simplifica: ,=T а Л (-іа V bV с) Л (-іа V -ibV ->c) —> (b V с) Л (->b V->c) (а V b) A ->b Л (-іа V ->b V с) a si de aici a = T, deci formula e realizabila R3) Daca , am terminat (si avem o atribuire) Daca se ajunge la o , formula а Л (  c) a=J  ? A (-1 ? V с) A (-1 ? V-ic) с A -ic c=>" 0 (-ic devine clauza vida => nerealizabila) Daca dupa aceste reguli ? а Л (-іа V ? V с) A (-  ? V-ic) 3=>" (b V с) A (->b V->c) ?? R4) Alegem o variabila si incercam ( ) cu valoarea F cu valoarea T O solutie pentru oricare caz e buna (nu cautam o solutie anume) Daca nici un caz nu are solutie, formula nu e realizabila Problema are ca date: lista clauzelor (formula) multimea variabilelor deja atribuite (initial vida) Regulile 1 si 2 ne (mai putine necunoscute sau clauze mai putine si sau mai simple) Regula 3 spune cand ne oprim (avem raspunsul) Regula 4 reduce problema la rezolvarea a (cu o necunoscuta mai putin) Reducerea problemei la (una sau mai multe instante) inseamna ca problema e Obligatoriu: trebuie sa avem si o function solve(truelit: lit set, clauses: clause list) (truelit, clauses) = simplify(truelit, clauses) (* Rl, R2 *) if clauses = lista vida then return truelit; (* R3: realizabila, returneaza atribuirile *) if clauses contine clauza vida then raise Unsat; (* R3: nerealizabila *) if clauses contine clauza cu unic literal a then solve (truelit U{a}, clauses) (* Rl: a trebuie sa fie T *) else try solve (truelit U{->a}, clauses); (* R4: incearca a=F *) with Unsat —> solve (truelit U{a}, clauses); (* incearca T *) Rezolvitoarele {SAT solvers checkers) moderne pot rezolva formule cu milioane de variabile (folosind optimizari) Structuri de date: clauzelor (lista de liste de literali) literalilor cu valoare T Prelucrari: unui literal in multimea celor atribuite unui literal la multimea celor atribuite literalilor dintr-o lista (clauza) unui literal dintr-o lista (clauza) unei clauze dintr-o lista (formula) un sir (numele variabilei) etichetat cu P (pozitiv)   N (negativ) module L = struct t = P string i N string = compare i P s -> N s i N s -> P s module S = Set Маке(L) (cod dupa Conchon et al, Sat-Micro, 2008) Sau reprezentam o propozitie pk prin indicele intreg к G H* si folosi indici negativi pentru negatie module L = struct t = int = compare x -x tset = multimea literalilor adevarati Gasirea unui literal adevarat e un caz special (R2a) nu mai continuam prelucrarea clauzei ( Exit) Altfel, pastram un literal daca nu e sunt sigur fals (R2b) (nu apare negat in multimea celor adevarate, tset) tset = List filter ( lit -> S mem lit tset raise Exit (S mem (L neg lit) tset)) Acumulam cu List,fold left o pereche de valori: multimea de literali adevarati si lista clauzelor modificate trueset = List fold left ( (tset, clst) cl -> ( filter clause tset cl i [] -> raise Unsat i [lit] -> simplify (S add lit tset) clst i newcl -> (tset, newcl :: clst)) Exit -> (tset, clst) ) (trueset, []) Daca filter clause da un unic literal, se adauga la cele adevarate si reluam simplificarea clauzelor deja prelucrate Daca returneaza lista vida, toata formula e nerealizabila Daca produce exceptia Exit, clauza nu are efect (e adevarata) Altfel, adaugam clauza simplificata la lista Daca simplificand obtinem lista vida de clauze, returnam multimea literalilor adevarati (restul nu conteaza) Altfel, cu primul literal din prima clauza incercam ambele valori daca prima incercare da exceptia Unsat, incercam si a doua clauses = tset clist = simplify tset clist i (tsl, (lit::cl)::ctail) -> S union tsl ( satl (S singleton (L neg lit)) (cl::ctail) Unsat -> satl (S singleton lit) ctail ) i (tsl, ) -> tsl S elements (satl S empty clauses) sat [ [P ; P ; N ] ; [N ; P ]; [P ; N ] ] - : S elt list = [N ; N ; N ] (а V b V -ic) Л (-іа V с) V (-,a Vb) e realizabila cua = b = c = F in   constrangere: Putem gasi o solutie la cu proprietatea ? => conditiile se pot exprima ca formule in logica in verificarea de circuite (ex optimizam functia f in fopt) daca f(vi,vn) = fopt(yi,      > vn) (echivalente) atunci -i(f(vi,vn) =  oPt(vi,vn)) e nerealizabila putem verifica daca transformarea (optimizarea) e corecta in verificarea de software (model checking), testare, depanare gasirea de teste care duc programul pe o anume cale gasirea de vulnerabilitati de securitate in software in biologie (determinari genetice), etc n propozitii: 2" atribuiri => timp incercand toate 0 atribuire data se verifica in timp (in dimensiunea formulei) = clasa problemelor care pot fi rezolvate in timp polinomial (relativ la dimensiunea problemei) = clasa problemelor pentru care o solutie poate fi in timp polinomial (a verifica e mai usor decat a gasi) Probleme : cele mai dificile probleme din clasa daca s-ar rezolva in timp polinomial, orice alta problema din NP s-ar rezolva in timp polinomial => ar fi P = NP (se crede ) Realizabilitatea (SAT) e prima problema demonstrata a fi (Cook, 1971) Sunt multe altele (21 probleme clasice: Karp 1972) Cum demonstram ca o problema e NP-completa (grea) ? o problema cunoscuta din NP la problema studiata => daca s-ar putea rezolva in timp polinomial problema noua, atunci ar lua timp polinomial problema cunoscuta Una din cele mai fundamentale probleme in informatica Se crede ca P NP, dar nu s-a putut (inca) demonstra imagine: http:   en Wikipedia org wiki File :P np np-complete np-hard svg Pentru logica prepozitionala, am discutat: : o formula are propozitie sau (-formula) sau (formula —> formula) : calculam (intelesul), pornind de la cea a propozitiilor , л | T daca i (a) = F darfv(")=T , эх i F daca i (a) = T si v(3) = F i (a —> p) = ip2 deducem inferam ( 3 —> a) A2: (a (J3 7)) ((a ->  3) (a 7)) АЗ: (-1 3 —> -ia) —> (a —>  3) in care a, 3 etc pot fi inlocuite cu orice formule Fie H o multime de formule 0 (demonstratie) din H e un sir de formule Ai, A2, • • • ,An, astfel ca V  G 1, n 1 A, este o , sau 2 A, este o (o formula din  - ), sau 3 Aj rezulta prin din Aj, A^ anterioare (j,k p pentru orice formula p (1) (( (p->p) Al (5) p —> p MP(3,4) unei demonstratii e un proces simplu, mecanic (cele 3 reguli de mai sus), chiar daca gasirea demonstratiei poate fi dificila Modus ponens e suficient pentru a formaliza logica prepozitionala dar sunt si alte reguli de deductie care simplifica demonstratiile p-> q -^q -p p p Jq p  q p pv q -p q P ? q q ? r p r Fie H = {а, —i ? V d, а — Aratati ca H i- e (1) a (2) a —> (b A c) (3) b A c (4) b (5) d (6) c (7) с A d (8) -,a V e (9) e > ( ? Л с), (с Л d) —> (-іа V е)} ipoteza, Hi ipoteza, Нз modus ponens (1, 2) specializare (3) eliminare (4,  - 2) specializare (3) (5) si (6) modus ponens (7,  - 4) eliminare (1, 8) Reamintim: o e o atribuire de adevar pentru propozitiile unei formule O formula poate fi adevarata sau falsa intr-o interpretare O multime de formule H = { int main(void) double d; int n; printf ("Adresa lui d: ° op n", &d) ;    de ex 0xbff60f38 printf ("Adresa lui n: ° op n", &n) ;    de ex 0xbff60f34 return 0; Programarea calculatoarelor Curs 7 Marius Minea Programarea calculatoarelor Adrese Tablouri siruri de caractere 3 Tablou (vector) = o secventa de elemente de de date asociaza о (тп) cu un anumit (n) (ca un sir matematic) Declarare: tip nume-tablou[nr-elem]', double x ; int mat ; initializat: intre acolade, cu virgule: int a = { 0, 1, 4, 9 - tabloului e la care incepe memorarea elementelor - tabloului (nr de elemente) = o pozitiva C99: dimensiuni variabile, dar valoare cunoscuta la momentul declararii ex parametru la functie: int f(int n) { int tab[n];   folosim tab } - un : dat de numele tabloului si un indice intreg: x ; ca indice se poate folosi orice expresie de valoare intreaga - un element de tablou poate fi folosit ca orice variabila individuala (are o valoare, si poate primi una noua, in stanga unei atribuiri) in C, numerotarea elementelor incepe de la zero! int a ; are elemente a , a[l], a , a , NU exista a Sintaxa declaratiei: tip #define MAX 100 int main(void) { unsigned pEMAX] = {2};    pr unsigned cnt = 1, n = 3;    av do { for (int j = 0; n % pEjl; ++j if (pEjl *p[j] > n) { p[cnt++] = n; break;    ++n;    } while (cnt numele tabloului NU poarta informatii despre dimensiunea lui exceptie: sizeof (numetab) este nr-elem * sizeof (tip-elem) La functii trebuie transmis tabloului ( ) s1 sa scriem lungimea intre [] la parametru, nu e luata in considerare #include void printtab(int t [] , unsigned len) { for (int i = 0; i un parametru tablou e transmis prin Avand adresa, functia poate accesa ( ) elementele tabloului void sumvect(double a[] , double b[], double r[], unsigned len) { for (unsigned i = 0; i void fractie(unsigned m, unsigned n) { int apare[n];    dimensiune data de parametrul n for (int i = 0; i trebuie cunoscut COL => la parametri trebuie toate dimens in afara de prima Ex: А^пх10 x Вюхб = Qmx6 void matmul(double a[] ,double b [] ,double c [] ,int lin) { for (int i = 0; i 0 dupa cum e sl fata de s2 char *strncpy(char *dest, const char *src, size t n);    copiaza cel mult n caractere din src in dest char *strncat(char *dest, const char *src, size t n);    concateneaza cel mult n caractere din src la dest int strncmp (const char *sl, const char *s2, size t n);    compara sirurile pe lungime cel mult n caractere size t: tip intreg fara semn pentru dimensiuni const: specificator de tip, indica ca obiectul respectiv nu e modificat Programarea calculatoarelor Curs 7 Marius Minea 15 noiembrie 2004 Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 2 La nivel de , ne referim la un fisier prin La nivelul , bibliotecile limbajului C definesc un tip cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF) Din punct de vedere logic, un fisier e un flux {stream} de octeti Lucrul tipic cu fisiere: se deschide, se prelucreaza, se inchide Fisiere standard predefinite (si deschise automat la rulare) : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pentru a putea fi separate (prin redirectare) de mesajele normale de iesire Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 3 FiLE *fopen (const char *path, const char *mode); - arg 1: numele fisierului (absolut sau fata de directorul curent) - arg 2: modul de deschidere; primul caracter semnifica: : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, e trunchiat la 0 (w) sau se adauga la sfarsit (append, a) in plus, sirul de caractere pt modul de deschidere mai poate contine: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod binar (implicit: in mod text) - returneaza NULLin caz de eroare (trebuie testat !!!) - altfel, valoarea returnata se foloseste pt lucrul in continuare int fclose(FiLE *stream); - scrie orice a ramas in tampoanele de date, inchide fisierul - returneaza 0 in caz de succes, EOF in caz de eroare Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 4 Secventa tipica de lucru cu un fisier (ex pt citire) FiLE *fp; char *name = "f txt";  * sau din argv[], sau solicitat *  if (! (fp = fopen(name, "r"))) {  * trateaza eroarea *  } else {  * lucreaza cu fisierul *  } if (fclose(fp))  * eroare la inchidere * ; La intrarea-iesirea in mod text se pot petrece diverse conversii in functie de implementare (de exemplu traducere  n in  r n pt DOS) Datele citite corespund celor scrise doar daca: toate caracterele sunt tiparibile,  t sau  n;  n nu e precedat de spatii; ultimul caracter e  n => pentru orice alte situatii, deschideti fisierele in mod binar (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc acelasi indicator de pozitie => Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 5 Cu functii echivalente celor folosite pana acum: int fputc(int c, FiLE *stream);  * scrie caracter in fisier *  int fgetc(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s);  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ 0’ la sfarsit => citirea sigura a unei linii, fara depasire Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C #include void cat(FiLE *fi) { int c; while ((c = fgetc(fi)) ! void main(int arge, char *argv[]) FiLE *fp; if (arge == 1) cat(stdin);  * c else while (—arge > 0) {  * pt if (!(fp = fopen(*++argv, "r" fprintf(stderr, "can’t open else { cat(fp); fclose(fp); } Programarea calculatoarelor 2 Curs 7 б = EOF) putchar(c); } { iteste de la intrare *  fiecare argument *  ))) ° os", *argv); Marius Minea Fisiere Functii sistem Preprocesorul C 7 void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * != 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * != 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum) ; din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s) ;  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 8 Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t runemb, FiLE *stream); size t fwrite(void *ptr, size t size, size t runemb, FiLE *stream);  * citesc scriu runemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror in C, nu exista fisiere tipizate (file of din PASCAL); putem insa defini astfel de functii pentru fiecare tip in parte: size t readint(int *pn, FiLE *stream)  * in format binar *  { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *  { return fwrite(&x, sizeof(double), 1, stream); } Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 9 #include #include #define MAX 512 int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;  * nr octeti cititi *  while (!feof(fi)) { size = fread(buf, 1, MAX, fi); fwrite(buf, 1, size, fo);  * scrie doar size *  if (ferror(fi) || ferror(fo)) return errno; return 0; Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 10 void main(int argc, char *argv[]) FiLE *fi, *fo; if (argc != 3) { fprintf(stderr, "usage: сору source destination n"); exit(-l); } else { if (! (fi = fopen(argv , "r"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (!(fo = fopen(argv , "w"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv ); perror(NULL); exit(errno); if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) | fclose(fo)) perror("Eroare la inchidere"); Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 11 Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long ftell(FiLE *stream);  * pozitia de la inceputul fisierului *  int fseek(FiLE *stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: seek set (inceput), seek cur (punctul curent), SEEK END (sfarsit) void rewind(FiLE *stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflush(FiLE *stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 12 void abortO; cauzeaza terminarea a programului; efectul pt tampoanele de date si fisierele deschise depinde de implementare int atexit(void (*func)(void)); inregistreaza functii pt apelare la terminarea normala a programului (actiuni specificate de programator, ex "doriti sa salvati fisierul ?") void exit(int status); termina normal executia programului, -intai se apeleaza functiile inregistrate cu atexit in ordine inversa - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO int system(const char *string); se executa comanda string (cu argumente) de procesorul de comenzi; daca string e null, returneaza != o daca exista procesor de comenzi Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 13 int remove(const char *filename); sterge un fisier int rename(const char *old, const char *new); redenumeste un fisier ambele functii returneaza o la succes si != o la eroare file *tmpf iie(void); creeaza fisier temporar, deschis in mod wb+ sters automat la sfarsit de program; de ex pt date temporare mari char *tmpnam(char *s); genereaza returneaza un nume nou de fisier numele e copiat si in s daca s e nenul (necesar: minim L tmpnam octeti) FiLE *freopen(const char * filename, const char * mode, FiLE * restrict stream); deschide fisierul filename si il asociaza cu fluxul stream (redirecteaza fluxul logic stream in fisierul fizic filename; returneaza null in caz de eroare, stream la succes inchide un eventual fisier asociat anterior cu stream) poate fi folosit pentru redirectarea intrarii iesirii din program Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 14 #include #include int fatal(char *msg) { perror(msg); exit(l); } int main(int argc, char **argv) char s ; if (argc != 2) fatal("lipseste nume fisier"); if (!freopen(argv , "r", stdin)) fatal("eroare la deschidere redirectare intrare"); if (!freopen(tmpnam(NULL), "w+", stdout)) fatal("eroare la creare redirectare iesire"); if (system("sort")) fatal("eroare la sortare"); if (fseek(stdout, 0, SEEK SET)) fatal("eroare repozitionare");  * prelucram fisierul de iesire; aici doar tiparim *  while (fgets(s, 80, stdout)) f printf (stderr, "° os", s) ; fclose(stdin); fclose(stdout); Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 15 Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf (s, "° od", &n) ;  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu ° on) *  Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 16 Functiile de tipul printf scanf au numar variabil de argumente ( ) Pentru a implementa o astfel de functie, trebuie un mod de acces la argumentele cu numar variabil, pornind de la ultimul arg numit => limbajul C defineste o serie de macro-uri in stdarg h - tipul va iist pentru a retine informatii despre lista de argumente void va start(va list ap, ultimarg); - initializeaza ap pornind de la adresa ultimului argument tip va arg(va list ap, tip); - returneaza urmatorul argument din lista, presupus a fi de tipul tip apelata repetat pentru fiecare argument; tipul argumentelor si numarul lor trebuie deduse din argumentele fixe (ex formatul la print scanf) void va copy(va list dest, va list src); - copiaza un va list, inclusiv punctul curent de prelucrare atins void va end(va list ap); - apelat pentru incheierea corecta a prelucrarii argumentelor Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 17 - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie #include sau #include "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) #define LEN 20  * substitutie textuala simpla *  int tab[LEN];  * pentru definirea de constante simbolice *  for (i = 0; i (В) ? (A) : (B)) #define swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } Obs: substitutia se face textual => pot aparea probleme subtile - folositi paranteze in jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Programarea calculatoarelor 2 Curs 7 Marius Minea Fisiere Functii sistem Preprocesorul C 18 pt a compila selectiv portiuni de cod din program in functie de optiuni (caracteristici arhitecturale; pt depanare; functionalitate in plus; etc) Sintaxa: grup-cod ::= test-ifgrup-cod grupuri-elifOpt grup-elseopt #endif test-if ::= #if expr-const | #ifdef identificator | #ifndef identificator grup-elif ::= #elif expr-const grup-cod (toate # apar grup-else ::= #else grup-cod pe linie noua) expr-const ::= cele obisnuite | #define DEBUG  * daca depanam *   * cod obisnuit *  #ifdef DEBUG printf("am ajuns aici, x = "); #endif  * alt cod obisnuit *  identificatori predefiniti: FiL defined identificator #if defined GNUC  * compilator GNU *  #if GNUC == 2  * versiunea 2 *   * cod specific pt versiune *  #else  * alta versiune *   * cod specific pt alta versiune *  #endif #endif ; LiNE DATE TiME Ex: fprintf (stderr, "eroare in ° os linia ° od n" , FiLE , LiNE ); Programarea calculatoarelor 2 Curs 7 Marius Minea 6 noiembrie 2003 Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 2 in limbajul C, orice variabila are o : o valoare numerica; indica locul din memorie unde e memorata valoarea variabilei da adresa operandului: &x e adresa variabilei x Operandul: orice poate folosit pe partea stanga a unei atribuiri (variabila, element de tablou, functie; NU pentru expresii oarecare) O adresa poate fi tiparita (in hexazecimal) cu formatul ° op in printf #include double d; int a ;  * variabile globale *  int main(void) int k;  * variabila locala *  printf ("Adresa lui d: ° op n", &d) ;  * de ex 0x80496c0 *  printf ("Adresa lui a : ° op n", &a );  * 0x80496e0 *  printf ("Adresa lui a : ° op n" , &a );  * 0x80496f4 *  printf ("Adresa lui k: ° op n" , &k) ;  * 0xbffff8e4 *  }  * Obs &a - &a == 5 * sizeof(int) (pozitii consecutive) *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 3 Orice expresie in C are un tip => la fel si expresiile adresa : Daca variabila x are tipul tip, &x are tipul tip * int x; => &x are tipul int *, adica pointer la int (adresa de int) char c; => &c are tipul char *, (pointer la char, adresa de char) => exista tipuri de adresa diferite pentru fiecare tip de date => putem variabile de aceste tipuri (pointeri): tip * nume var; nume var e pointer la (adresa pt ) o valoare de tip = o variabila care contine adresa altei variabile da obiectul *p de la adresa data de operandul p Operand: pointer Rezultat: referinta la obiectul indicat de pointer => operator de indirectare (dereferentiere, referire indirecta prin adresa) Daca pointerul p are tipul tip *, *p are tipul tip Sintaxa declaratiei (aceeasi dar citita in doua feluri) sugereaza folosirea: char* p; p e o variabila de tipul char * (adresa de char) char *p; *p (obiectul de la adresa p) are tipul char Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 4 Pointerii au adrese, ca orice variabile: pt int *p; adresa &p are tipul int ** int ** pp = &p; => pp are tipul int **, adica adresa unei adrese de int dar putem citi int* *pp sau int **pp deci *pp are tipul int * (adresa de int) si **pp are tipul int (val de la adr *pp) Variabila int **pp=&p; Valoare 0x408 0x51C Adresa 0x408 0x51C 0x9D0 5 inainte de folosire, un pointer trebuie variabile de tipul potrivit: int x, *p, , de ex cu adresa unei **pp; p = &x; pp = &p; O *p poate fi folosita (in cazul de mai sus, *p se foloseste absolut la fel (sinonim) cu x) int x, y, z, *p; p=&x; z=*p;  * z = x *  *p=y;  * x = у *  : Operatorii adresa & si de indirectare * sunt *&x este chiar x, pentru orice obiect (variabila) x &*p are valoarea p, pentru orice variabila pointer p (dar p e o variabila si poate fi atribuita; &*p e o expresie si nu poate) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 5 Utilizarea oricarei variabile neinitializate e o eroare logica in program ! { int x; printf ("° od", x) ; }  * cat e x ?? valoare la intamplare! *  , ca orice variabile ! - cu adresa unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie alocata dinamic (vom discuta ulterior) : tip *p; *p = valoare; p este !! (eventual nul) => valoarea va fi scrisa la o adresa de memorie necunoscuta (evtl nula) => coruperea memoriei, rezultare eronate sau imprevizibile, terminarea fortata a programului (sub sisteme de operare cu memorie protejata) definit in stddef h ca (void *)o: nu e o adresa valida => folosit (la initializari, sau returnat) ca valoare de pointer invalid : pointerii au valori numerice, dar nu sunt acelasi lucru ca intregii => Nu convertiti intre pointer si int (e dependent de implementare) : Un prim test al corectitudinii programului: Verificati ca expresiile au tipuri corespunzatoare (ex la atribuire) => valabil si pentru pointeri (nu confundati p cu *p, etc ) Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri б Permit prin transmiterea adresei ei - o variabila se poate modifica prin indirectarea unui pointer catre ea - nu se modifica adresa (transmisa tot prin valoare) ci continutul ei void swap (int *pa, int *pb)  * schimba val de la adr pa si pb *  int tmp;  * variabila auxiliara necesara pentru interschimbare *  tmp = *pa; *pa = *pb; *pb = tmp;  * trei atribuiri de intregi *  }  * in functie s-a lucrat cu continutul de la adresele pa si pb *  Ex : int x = 3, у = 5; swap(&x, &y);  * acum x = 5 si у = 3 *  : Nu se poate obtine efectul cu void swapdnt m, int n); (ar schimba valorile transmise in corpul functiei, fara efect in afara) Folosire: cand limbajul nu permite transmiterea prin valoare ( ) sau ar fi ineficienta (structuri mari) => transmitem adresa variabilei Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 7 in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare Declararea unui tablou aloca un bloc de memorie pt elementele sale => blocului respectiv (= a primului element) => pentru tabloul tip a[LEN]; numele a e o de tipul tip * &a e echivalent cu a (adresa tabloului e adresa primului element) a e echivalent cu *a (obiectul de la adresa a e primul element) Daca declaram tip *pa; putem atribui pa = a; Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu de memorie si are o adresa &pa adresa Pa 5C0 int a ; 5E0 int *pa = a; Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 8 in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s []) ; sau size t strlen(char *s) ; (de fapt, compilatorul converteste prima varianta in a doua) size t: tip pt dimensiuni pozitive din stddef h (ca si unsigned sauunsigned long) => nu se transmit tablouri (bloc de memorie) la functii, ci adresele lor Fie char t ; Compilatorul considera &t ca fiind t => s-ar putea scrie si scanf ("° 020s", &t) in loc de scanf ("° 020s", t) se recomanda totusi prima varianta, pentru uniformitate cu cazul: char *p; p = s; scanf ("° 020s", p)  * aici e incorect &p ! *  Diferenta intre tablouri si pointeri: sizeof t == 21*(sizeof char) diferit de sizeof p == sizeof(char *) Atentie! Verificati corespondenta tipurilor in expresii Ex char m ; char *p; p si m nu au acelasi tip, dar p si m au ! Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 9 O variabila v de un anumit tip ocupa sizeof(tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou a + i e echivalent cu &a[i] iar *(a + i) e echivalent cu a[i] char *endptr(char *s) {  * returneaza pointer la sfarsitul lui s *  char *p = s;  * sau: char *p; p = s; *  while (*p) p++;  * adica la pozitia marcata cu ’ 0’ *  return p; 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , 0 pt sl>s2, 0 pt egal *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 11 char *strncpy(char *dest, const char *src, size t n) { char *p = dest;  * copiaza cel mult n caractere *  while (n— && *p++ = *src++); return dest; int strncmp (const char *sl, const char *s2, size t n) { if (n == 0) return 0;  * compara pe lungime cel mult n *  while (—n && *sl == *s2 && *sl) { sl++; s2++; } return *sl - *s2;  * 0 pt sl>s2, 0 pt egal *  char *strchr(const char *s, int c) {  * cauta primul c in s *  do if (*s == c) return s; while (*s++); return NULL;  * daca nu a fost gasit *  void *memset(void *s, int c, size t n);  * seteaza n octeti cu c *  void *memcpy(void *dest, const void *src, size t n); void *memmove(void *dest, const void *src, size t n);  * copiaza n octeti; ultima varianta si pentru zone suprapuse *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 12 Fie declaratia tip a[DlMl] [DiM2]; Elementul a[i] [j] este al j-lea element din tabloul de DiM2 elemente a[i] si are adresa &a[i] [j] == (tip *)(a + i) + j == (tip *)a + DiM2*i + j => pentru compilarea expresiei a[i] [j] e necesara cunoasterea lui DiM2 => in declaratia unei functii cu parametri tablou trebuie precizate toate dimensiunile in afara de prima (irelevanta): void f(int m[] ); Declaratiile char s[] = "sir"; si char *s = "sir"; sunt diferite! - prima rezerva spatiu doar pt sirul "sir", iar adresa s e o constanta - a doua rezerva spatiu si pentru pointerul s, care poate fi reatribuit char s ={"ian", ,"dec"}; si char *s ={"ian", ,"dec"}; primul e un tablou 2-D de caractere, al doilea e un tablou de pointeri Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 13 Limbajul C permite accesul la parametrii argumentele) cu care programul e rulat din linia de comanda (ex optiuni, nume de fisiere) De asemenea, permite returnarea de program a unui cod intreg (folosit uzual pentru a semnala succes sau o conditie de eroare) #include int main(int argc, char *argv[]) { int i; printf ("Numele programului: ° os n" , argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (i = 1; i = 1 - argv[l], etc : parametrii, asa cum au fost separati de spatii Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 14 Adresa unei functii se poate obtine, memora, si utiliza pentru a o apela, pentru o functie tip rez fct (tipl, , tipn); adresa are tipul tip rez (*pfct) (tipl, , tipn)-, se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Atentie la sintaxa: int *fct(void); declara o functie ce returneaza pointer la intreg int (*f ct) (void); declara un pointer la o functie ce returneaza intreg Exemplu de utilizare: parametrizarea unei alte functii Algoritmul quicksort, declarat (in stdio h) ca functie cu parametrii: - adresa tabloului de sortat, numarul si dimensiunea elementelor - adresa functiei care compara 2 elemente (returneaza 0) efectuarea compararii depinde de tip: intreg, sir, definit de utilizator void qsort(void *base, size t num, size t size, int (*compar) (void *, void *)); - foloseste argumente void * fiind compatibile cu pointeri la orice tip Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 15 - pentru tabele de rutine, apelate in functie de un indice - exemplu: meniu cu apelare de functii in functie de tasta apasata void help(void); void menu(void);  * *  void quit(void); void (*funtab) (void) = { help, menu, quit void do cind(void) int к = getcharO - ’0’; if (k >= 0 && к e util sa declaram un tip: typedef void (*funptr)(void);  * pointer la functie void *  funptr funtab ;  * tabloul de pointeri de functie *  Utilizarea si programarea calculatoarelor Curs 7 Marius Minea Pointeri 16 Pana acum am atribuit la pointeri doar adrese de variabile existente si am declarat static doar variabile de dimensiuni cunoscute la compilare Discutam: functii de gestiune dinamica a memoriei (stdlib h): alocarea memoriei dupa necesitati stabilite la rularea programului void *malloc(size t size);  * aloca size octeti *  void *calloc(size t num, size t size);  * num*size oct init 0 *   * m calloc returneaza NULL la eroare (ex mem insuficienta) *  void *realloc(void *ptr, size t size);  * modifica dimensiunea, poate muta blocul, dar pastreaza continutul memoriei *  void free(void *ptr);  * elibereaza mem alocata cu c malloc *  int i, n, *t; printf ("Nr de elemente ?") ; scanf ("° od", &n) ; if ((t = malloc(n * sizeof(int)) != NULL) for (i = 0; i #include #define NUM 100  * alocam pt 100 de numere odata *  typedef int (*cmpptr)(const void *, const void *) ; int cmp(int *p, int *q) { return *p - *q; }  * pt sortare *  void main(void) { int i=0, n=0, *t= NULL;  * contor, total, tablou *  do {  * aloca cate NUM intregi, initial si cand e nevoie *  if (i == n) { n += NUM; t = realloc(t, n*sizeof(int)); } scanf ("7od", &t [i]) ;  * realloc(NULL, sz) e ca si malloc(sz) *  } while (t [i++]); qsort(t, i, sizeof(int), (cmpptr)cmp);  * sorteaza *  for (n = 0; n q q Modus ponens e suficient, dar sunt si alte reguli de deductie valide Logica prepozitionala e : orice formula demonstrata (teorema) e valida : orice formula valida (tautologie) poate fi demonstrata in pentru programe: de exemplu, sortare in conditii ( M filter ( ) pentru datele de prelucrat к v -> к = 5) stud dict exprimand riguros proprietati: axioma multimii vide Bempty Vx -contains(empty x) descriind structuri informatice: fisiere si cataloage Vx ((f 7e(x) Ax root) —> contains(parent(x) x)) Un exemplu clasic: (1) Toti oamenii sunt muritori (2) Socrate e om Deci, (3) Socrate e muritor Acesta e un (tipar de regula de inferenta) logica clasica: Aristotel, stoici Seamana cu modus ponens dar premisa din (1) ("toti oamenii") nu e la fel cu (2) (Socrate, un anumit om) Am putea reformula (1): Daca X e om, atunci X e muritor, mai precis: Pentru orice X, daca X e om, atunci X e muritor Logica moderna: (logica de ordinul i) Gottlob Frege, Charles Peirce (sec 19) sunt formate din legate prin Vx ((f 7e(x) Ax root) —> contains(parent(x) x)) in loc de (a, p, q) avem : file(x), contains(x y) Un = o afirmatie relativ la una sau mai multe variabile, care, dand valori variabilelor, poate lua valoarea adevarat sau fals Predicatele au argumente x   : parent(x) intuitiv: reprezinta obiecte notiuni si functii din univers Nou: apar Definim numita si (orice), ( (intai) (exista) Definim, structural recursiv, notiunile de si       ,in) cu f n-ara si ti,       , in Exemple: parent(x), cmmdc(x,y), max(min(x,y),z) c: caz particular, functie de zero argumente (well-formed formulas, formule bine formate): P(ti,       ,in) cu P de n argum si ti,       , in Exemple: contains(empty x), divide(cmmdc(x,y),x) p: caz particular, predicat de zero argumente -ia unde a e o formula a —> (3 cu a, (3 formule  fva cu v , a formula: Exemple: Vx —contains(empty x), VxVy divide(cmmdc(x y),x) ti = t2 cu ti, t2 termeni (in logica de ordinul i cu egalitate) Exemplu: min(x, min(y, z)) = min(min(x,y), z) Termenii si formulele se pot traduce direct in term = V i F string string * term list predform = Pr string * term list 1 Neg predform i And predform * predform i Or predform * predform i Forall string * predform 0 formula poate contine termeni Termenii nu contin formule! Reprezentam constantele ca functii cu zero argumente Atat termenii cat si predicatele au argumente: lista de termeni Exemplu: Vx ->Vy P(x, f(y)) ForallC , Neg(Forall( , Pr( ,[V ; F( , [V Notam: Зхір = p formula arbitrara Exista x pentru care ф e adevarata o nu pentru orice x ф e falsa Cei doi cuantificatori sunt Putem scrie si  fxip = -іЭх(-к^) Cuantificatorii au decat conectorii Л, —> => daca formula cuantificata are Л, V, —> folosim paranteze: 3x(P(x) Q(x)) Vy(Q(y) Л  ?(x,y)) Alta notatie: cuantificatorul se aplica la tot restul formulei, pana la sfarsit sau paranteza inchisa P(x) V (R(y) V ) A S(x) in logica se pot cuantifica (V, 3) doar variabile in logici de ordin superior ( ) se pot cuantifica si predicate Cuantificatorul e distributiv fata de conjunctie’   x(P(x) Л Q(x)) о Vx P(x) Л Vx Q(x) dar cuantificatorul NU c distributiv fata de conjunctie: 3x(P(x) A Q(x)) jA (Зх P(x) A 3x Q(x)) avem implicatie —>, dar nu si invers, poate sa nu fie acelasi x i Dual, 3 e distributiv fata de disjunctie: Зх P(x) V 3x Q(x) о Зх Р(х) V Q(x) V nu e distributiv fata de disjunctie Avem doar: Vx P(x) V Vx Q(x) —> Vx P(x) V Q(x) in formula Vvtp (sau 3v ) variabila v se numeste Variabilele care nu sunt legate se numesc O variabila poate fi libera si legata in aceeasi formula in (Зх Р(х) —> Q(x)) Л  ?(x), x e in 3x P(x) —> Q(x) si e in R(x) (e in afara cuantificatorului) intelesul unei formule de variabilele legate intelesul lor e " " de cuantificator ("pentru orice", "exista") pot fi redenumite, fara a schimba intelesul formulei (Зх Р(х) —> Q(x)) Л R(x) la fel ca (Sy P(y) —> Q(y)) Л  ?(x) 0 formula are inteles de sine statator Rol similar: parametrii formali la functii in limbaje de programare putem sa ii redenumim fara a schimba efectul functiei x -> x + 3 si у -> у + 3 sunt aceeasi functie interpretarea unei formule de variabilele sale libere (ce valoare din univers au; discutam la semantica formulelor) La fel si x -> x + у intelesul depinde de definitia lui у (presupus declarat anterior) Formulele contin: devin (ca in limbajul natural): cumpara(X, Y), scade(X), si (in)directe: predicatului (proprietati) devin despre valorile-argument bucuros(X), de-aur(Y) Variabilele din formule pot lua valori din nu au un tip anume (vezi: logica cu sorturi, ) => devin tot predicate, cu argument obiectul de acel fel copil(X), ca et(X) Entitatile devin constante: ion, emptyset, santaclaus 1 Fiecare investitor a cumparat actiuni sau obligatiuni Cuantificatorii introduc variabile cu valori din univers => impunem categorii prin predicate suplimentare introducem un predicat шѵ(Х) (X e investitor) Pentru orice X, daca X e investitor a facut ceva VX  nv(X) —> ce face X ce a cumparat ce stim despre C Ce se spune despre investitor? Exista ceva VX  nv(X) —> 3 C cumpara(X, С) A VX  nv(X) —> 3 C cumpara(X, С) A (act une(C) V oblig(C)) Sursa: http:  www cs utexas edu users поѵак reso html 2 Daca indicele DowJones scade, toate actiunile mai putin aurul scad indicele Dow Jones e o notiune unica folosim o constanta dj alternativ: puteam folosi si o scadedj scade(dj) —> ce se intampla scade(dj) —> VX conditii pentru X —> scade(X) scade(dj) —> VX actiune^X) Л -iaur(X) —> scacfe(X) 3 Daca trezoreria creste dobanda, toate obligatiunile scad, crestedob —> VX oblig(X) —> scade(X) Dobanda e unicul lucru din problema care creste => propozitie alternativ: o constanta dobanda + predicat creste 4 Orice investitor care a cumparat ceva care scade nu e bucuros s'X inv(X') —> ce stim despre X   X inv(X) —> ( conditie pentru X —> -ibucwos(X)) VX  nv(X) —> (3 C cumpara(X, С) Л scade(C)) —> -bucuros(X) —> asociaza la dreapta, p—> r = p—>(q—>r) = p Л q —> r, echivalent: ѴХ шѵ(Х) Л (3 C cumpara(X, С) Л scade(C)) —> -bucuros(X) 5 Daca indicele Dow Jones scade si trezoreria creste dobanda, toti investitorii bucurosi au cumparat ceva actiuni de aur scade(dj) Л crestedob —> ce se intampla scade(dj) Л crestedob —> У X inv(X) Л bucuros(X) —> ce stim despre X scade(dj) Л crestedob —> VX  nv(X) Л bucuros(X) —> 3 C cumpara(X, С) Л actiune(C) Л aur(C) Cuantificatorul ("toti") cuantifica o Toti studentii sunt tineri Studenti C Tineri   x student{x) —> tanar(x) : Л in loc de —>:   x student{x) Л tanar{x) Oricine orice din univers e si student si tanar!!! Cuantificatorul ("unii" Exista premianti studenti Premianti П Studenti 0 "exista") cuantifica o 3x premiant(x) Л student(x) : —> in loc de Л: Bx premiant(x)—> student (x) E adevarata daca exista un ne-premiant! (fals implica orice) Avand o (valori din univers, functii, valori pentru relatii predicate), nu putem scrie tabele de adevar Putem face insa (deductii) dupa (pur sintactice), ca in logica prepozitionala Logica predicatelor e si ea si (adevarata in toate interpretarile atribuirile) (tautologie) poate fi (e teorema), dar daca nu e valida, incercarea de a o demonstra (sau o refuta) poate continua la nesfarsit O formula е daca si numai daca ei e o Putem demonstra o teorema prin aratand ca (nerealizabila) Fie ipotezele Ai, A2,      , An si concluzia C Fie teorema Ai Л Д2 • • • A An —> C adica: ipotezele Ai, A2, An implica impreuna concluzia C Negatia implicatiei: ->(H —> С) = ->(—> -  V С) = H Л ->C Deci aratam ca Ai Л Д2 • • • Л An A ->C e o contradictie ( : ipoteze adevarate+concluzia falsa e imposibil) Aratam ca o formula e o contradictie prin Rezolutia e o care produce din doua clauze cu (p si ->p) рѵд -прѵ в А   В "Din clauzele p V A si ->p V В deducem derivam clauza А V B" Reamintim: V de (propozitii sau negatii) Clauza obtinuta = celor doua clauze in raport cu p Exemplu: rez ( VqV-ir, V s) = q V -*r V s poate fi privit ca un p V false -ip V q false V q р  А ^р  В aVb Rezolutia e o regula de inferenta {p V А,^р   В} |= Д V В orice atribuire care face premisele adevarate face si concluzia adevarata pentru p = T, trebuie sa aratam В |= Д V B: daca В = T, atunci si А V В = T simetric pentru p = F, deci regula e valida Corolar: daca А V В e contradictie, la fel si (p V Д) A(-pV B) daca ajungem la contradictie, si formula initiala era contradictie (а V -ibV ->d) b negat Л (-іа V ->b) b negat Л (-іа V с V ->d) Л (-13 V b V c) b pozitiv Luam o propozitie cu ambele polaritati (b) si construim rezolventii rezb(a V -ib V -id, -iaV b V с) = з V -id V -,aV с = T rez >(-i3 V ->b, -13 V b V c) = -13 V ->a V с = ->a V c Adaugam noii rezolventi (ignoram T); eliminam vechile clauze cu b (- а V с V -id) A (-іа V c) Nu mai putem crea rezolventi Nu avem clauza vida formula e realizabila, de exemplu cu a = F Sau cu с = T Pentru o atribuire suficienta ca sa faca formula realizabila, revenim la formula initiala, si dam valori si lui b si sau d а Л (-іа V b) Л(-іЬѴс) с pozitiv Л (-іа V-ib V-ic) с negat Aplicam rezolutia dupa c, avem o singura pereche de clauze: rezc(-ib V c, -13 V -ib V -ic) = -ib V -13 V -ib = -13 V -ib Eliminam cele doua clauze cu c si adaugam clauza noua: 3 A (-13 V b) A (-13 V ->b) Aplicam rezolutia dupa b: rez >(-i3 V b, -13 V ->b) = -13 V -13 = -13 Eliminam cele doua clauze cu b, adaugam clauza noua: 3 ь A -13 Aplicam rezolutia dupa a: reza(a  a) = F (clauza vida) Deci formula initiala e o contradictie (e nerealizabila) Pornind de la o formula in forma normala conjunctiva (CNF), , incercand sa Alegem o propozitie p si adaugam toti rezolventii in raport cu p: din m clauze cu p si n clauze cu —*p, cream m   n rezolventi am eliminat p => stergem cele m+n clauze initiale Daca vreun rezolvent e , formula e Daca nu mai putem crea rezolventi (literalii au polaritate unica), formula e (facem T toti literalii ramasi) Numarul de clauze poate creste exponential (problematic!) Algoritmul DPLL aplica rezolutia doar la clauze cu un literal formula nu creste, dar poate incerca nr exponential de cazuri in logica predicatelor, un nu e o propozitie, ci un nu doar p si —>p, ci P(argl) si -iP(arg2) (argumente diferite) Pentru a deriva o noua clauza din А V P(argl) si В V -iP(arg2) trebuie sa incercam sa aducem argumentele la o expresie comuna Vom avea clauze cu variabile implicit cuantificate universal pot lua orice valoare => le putem cu Exista o substitutie care aduce predicatele la o forma comuna? ex 1: P(x,g(y)) si P(a, z) ex 2: P(x, g(y)) si P(z, a) in exemplul 1, substituind x a, z g(y) obtinem P(a,g(y)) si P(a, g(y)) => am gasit o forma comuna in ex 2 nu putem substitui a cu g(y) (a nu e variabila) g e functie arbitrara, nu stim daca exista un у cu g(y) = a О е о care asociaza unor niste {хі ь-> ti, ,хп in} Doi termeni se pot daca exista o substitutie care ii face egali f(x, g(y, z), t){x h(z),у h(b), u} = f(h(z),g(h(b),z), u) O x poate fi unificata cu orice t (substitutie) daca x in t (altfel, substituind obtinem un termen infinit) deci nu: x cu g(x, z)); dar trivial, putem unifica x cu x Doi f( ) Pot fi unificati doar daca au aceeasi functie, si (termeni) pot fi unificate (pozitie cu pozitie) Doua (functii cu 0 arg ) => unificate daca sunt identice Vom discuta ulterior detalii si un algoritm de unificare Fie clauzele: A cu P( ) si B, cu -iP( ) ( ) Exemplu: A- P(x, g(y)) V P(h(a), z) V Q(z) B- -^P(h(z), t) V R(t, z) Alegem niste (>1) P( ) din A si niste -iP( ) din B aici: toti variabilele comune (nu au legatura intre A si B) A: P(x,g(y))VP( i(a),z)VQ(z) B: -lP(h(z2), t) V R(t, z2) (toti odata) doar acei P( ) din A si -iP( ) din В alesi {Р(х,ё(уУ), P(h(a z  P(h(z2), t)} x ь-> h(a);z2 ь-> a;z, t i—> g(y) pe P( ) si |B( ) alesi din А V B rezultata si la lista clauzelor C e Metoda rezolutiei e relativ la refutatie pentru orice formula nerealizabila, va ajunge la clauza vida dar nu poate realizabilitatea (exista formule pentru care ruleaza la infinit) Reluam exercitiul formalizat anterior Folosim () si nu pentru a evita greseli la aplicarea cuantificarii Al: VX( nv(X) —> 3 C(cump(X, С) Л (act(C) V od  g(C)))) Д2: scadedj —> VX(act(X) A -aur(X) —> scade(X)) Д3: crestedob —> VX(oblig(X) —> scade(X)) Д4: VX( nv(X) —> (3 C(cump(X, С) A scade(C)) —> -ifwcur(X))) C: scadedj A crestedob —> VX(inv(X) A bucur(X) —> 3 C(cump(X, С) A act(C) A aur(C))) Negam concluzia , inainte de a transforma cuantificatorii! - С: -(scadedj A crestedob —> VX(inv(X) A bucur(X) —> 3 C(cump(X, С) A act(C) A aur(C)))) 1 : Д —> В = ^Д V В, ^(Д —> В) = Д Л ^B Orice transformare formula NU afecteaza ce ein afara ei! in Vx A, transformand oricum (—>, ) NU se schimba Vx 2 Ducem : - VxP(x) = Зх-іР(х) -i3xP(x) = Vx^P(x) Au VX( nv(X) —> 3 C(cump(X, С) A (act(C) V ob  g(C)))) VX(-i m (X) V 3 C(cump(X, С) A (act(C) V ob  g(C)))) Д2: scadedj —> VX(act(X) A -iaur(X) —> scade(X)) -scadedj V V X( act(X) V aur(X) V scacfe(X)) Д3: crestedob —> VX(oblig(X) —> scade(X)) -crestedob V V X( oblig(X) V scacfe(X)) Д4: VX( m (X) —> (3 C(cump(X, С) A scade(C)) —> -ibucur(X))) VX(-i m (X) V -13 C(cump(X, С) A scade(C)) V -ibucur(X)) VX(-i m (X) V V C(-icump(X, С) V -iscacfe(C)) V -ibucur(X)) -*C- -(scadedj Л crestedob —> VX(inv(X) A bucur(X) —> 3 C(cump(X, С) Л act(C) Л aur(C)))) ->C : scadedj Л crestedob Л -iVX(inv(X) Л bucur(X) —> 3 C(cump(X, С) Л act(C) Л aur(C))) scadedj Л crestedob Л 3X(inv(X) Л bucur(X) Л -13 C(cump(X, С) Л act(C) Л aur(C))) scadedj Л crestedob Л 3X(inv(X) Л bucur(X) Л V C(-icump(X, С) V -iact(C) V -iaur(C))) 3 Dam variabilelor cuantificate in fiecare formula, pentru a putea elimina ulterior cuantificatorii De exemplu: Vx P(x) V Vx 3y Q(x, y) devine Vx P(x) V Vz 3y Q(z,y) Nu e nevoie in exemplul nostru: Ді: VX(-> nv(X) V 3 C(cump(X, С) A (act(C) V ob  g(C)))) Д2: -^scadedj V VX( act(X) V aur(X) V scade(X)) Д3: -^crestedob V VX(-iob  g(X) V scade(X)) Д4: VX(-i nv(X) V V C(-icump(X, С) V -iscade(C)) V -ibucur(X)) - С: scadedj A crestedob A 3X( nv(X) A bucur(X) Л V C(-icump(X, С) V -iact(C) V -iaur(C))) 4 : in Vxi Vxn3y, alegerea lui у dexi, xn; introducem o noua у = g(xi, ,xn), 3y dispare Al: VX(-i nv(X) V 3 C(cump(X, С) Л (act(C) V ob  g(C)))) C din 3 depinde de X => C devine f(X), 3C dispare VX(-> nv(X) V (cump(X, f(X)) Л (act(f(X)) V od  g(f(X))))) Atentie! fiecare cuantificator primeste o Skolem! Pentru 3yin oricarui V, alegem o noua -iC: scadedj A crestedob A 3X( nv(X) A bucur(X) ЛѴ C(-icump(X, С) V -iact(C) V -iaur(C))) X devine o noua b (nu depinde de nimic), 3X dispare scadedj A crestedob Л шѵ(Ь) A bucur(b) MC(-cump(b С) V -iact(C) V -iaur(C)) 5 Ducem Д4: VX(-i nv(X) V V C(-icump(X, С) V -iscade(C)) V -ibucur(X)) VXVC(-> nv(X) V -icump(X, С) V -scade(C) V -ibucur(X)) 6 (devin impliciti, o variabila poate fi inlocuita cu orice termen) Ді: -i nv(X) V (cump(X, f(X)) Л (act(f(X)) V ob  g(f(X)))) Д2: -scadedj V -iact(X) V aur(X) V scade(X) Д3: -crestedob    -oblig(X)    scade(X) Д4: -i nv(X) V -icump(X, С) V -iscacfe(C) V -ibucur(X) -iC: scadedj A crestedob A inv(b) A bucur(b)   (-cump(b С) V -iact(C) V -iaur(C)) 7 Ducem ul disjunctiei (distributivitate) si scriem fiecare clauza separat ( , CNF) (1) V cump(X, f(X)) (2) V act(f(X)) V ob  g(f(X))) (3) -scadedj V -iact(X) V aur(X) V scacfe(X) (4) -crestedob V -oblig(X) V scacfe(X) (5) V -icump(X, С) V -iscade(C) V -bucur(X) (6) scadedj (7) crestedob (8) inv(b) (9) bucur(b) (10) -cump(b С) V -iact(C) V -iaur(C) Cautam predicate P( ) si si unificam, obtinand rezolventii: (11) -iact(X) V aur(X) V scacfe(X) (3, 6) (12) -cump(b С) V -iact(C) V scacfe(C) (10, 11, X= C) (13) -oblig(X) V scacfe(X) (4, 7) Cand unificam, redenumim clauzele sa nu aiba variabile comune: (13) - ) (20) 0 (contradictie = succes in reducerea la absurd) (8, 19) Putem traduce ( Putem negam concluzia transformam in prin metoda ) din limbaj natural in logica predicatelor prin reducere la absurd: (conjunctie Л de disjunctii V) gasim o (clauza vida) Programarea calculatoarelor Curs 8 Functii de intrare iesi re 14 aprilie 2009 Marius Minea char *fgets(char *s, int size, FiLE *stream);   deci, in stdio h Citeste pana la (si inclusiv) linie noua  n, dar max size-1 caractere pune linia in tabloul s, adauga J 0J la sfarsit Exemplu: char tab ; fgets(tab, 80, stdin); Parametrul al treilea: un (discutam ulterior); pentru a citi de la , folosim identificatorul (din stdio h) fgets returneaza daca n-a citit nimic (sfarsit de fisier) la succes: returneaza chiar adresa primita parametru (deci nenula) =4" Testam de rezultat nenul pentru a sti daca s-a citit cu succes: Exemplu: citire + afisare linie cu linie pana la sfarsitul intrarii char s ; while (fgets(s, 81, stdin)) printf("%s", s); liniile mai lungi de 80 de caractere se citesc afiseaza pe bucati NU folositi functia gets ! Nu se poate specifica lungimea maxim disponibila =4" se poate depasi zona de memorie alocata! =4" program abandonat, corupere de memorie, vulnerabilitati de securitate Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesi re int printf(const char* format, );    tiparire formatata returneaza: nr de caractere tiparite; in format: specificatori %c char, %d decimal, %f float, %p pointer, %s sir, %u unsigned, %x heXa restul parametrilor: de tiparit (orice ) int scanf(const char* format, );    citire formatata restul parametrilor: variabilelor de citit: (mai putin la siruri) Exemple: int n; scanf ("%d", &n); float a ; scanf ("%f", &a ); Format: ca printf, cu unele diferente Ex %f float, %if double returneaza: variabilelor citite (atribuite) (NU valoarea!), sau EOF daca apare o eroare de intrare inainte de citirea primei variabile =4" folosim rezultatul pentru a testa daca s-au citit cele dorite: int n; if (scanf("%d", &n)==l) { * s-a citit* } else { * eroare * } Utilizatorul poate introduce orice si oricat =4> la orice citire (fgets, getchar, scanf etc ) ! Programarea calculatoarelor Curs 8 Pe langa specificatori, sirul de format poate avea la printf: se tiparesc; la scanf: unsigned z, 1, a; scanf("%u %u %u", &z, &1, &a);    15 4 2008 cu scanf citeste pana cand intrarea formatului, apoi revine Restul variabilelor nu se atribuie; caracterele necitite raman in intrare scanf ("%d%d", &x, &y); in: 123A ret 1; x = 123, y: necitit; ramas: A scanf ("%d%x" , &x, &y); in: 123A ret 2; x = 123, у = OxA (10) La eroare trebuie inainte de a solicita din nou date: int m, n; printf("introduceti doua numere: "); while (scanf ("%d%d", &m, &n) != 2) -{    cat timp nu e corect while (getcharO != ’ n’);    consuma restul liniei printf("mai incercati o data: "); }    acum putem folosi m si n Tipar uzual: while ( citit bine) prelucreaza : while (fgets( )) while ((c = getcharO) != EOF) while (scanf ( ) == Cate-cer) Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesi re Functii de intrare iesi re Citirea unui caracter: char c; scanf ("%c", &c); testati rezultatul (1?) Mai Simplu: int c = getcharO; if (c != EOF)    valoare de char Citirea mai multor caractere: intr-un tablou (sir), in limitele acestuia: - un (orice pana la spatiu alb) char t ; scanf ("%32s" , t); consuma si ignora spatii albe initiale; adauga J 0J la sfarsit - un : char tab ; scanf("%80c", tab); orice caractere, inclusiv spatii albe; NU adauga J 0J la sfarsit - sir dintr-o (- pt intervale) % [ ] char a ; scanf("%32[A-Za-z ]", a); max 32 litere sau - sir % [" ] char t ; scanf ("%80 [ , 0-9]", t); max 80, pana la cifra , sau Numele de tablou , nu mai trebuie pus & E intre % si s [] [' ] (-1 fata de tablou, pt ’ 0’) lipsa e o =4" corupere de memorie, atacuri de securitate Formatul Citeste CUVant (pana spatii), nu linie! Formatul NU e H-s Programarea calculatoarelor Curs 8 Marius Minea - formatele si consuma (sar peste) spatii albe initiale "%d%d" doi intregi separati si eventual precedati de spatii albe - formatele c [ ] [  ] nu sar peste spatii albe; ele nu au rol special - un in sirul de format consuma oricate spatii albe din intrare scanf (" "); consuma toate spatiile albe pana la primul alt caracter "%c %c" citeste caracter arbitrar, consuma spatii, citeste alt caracter "%d %f" acelasi efect ca "%d%f" (spatiile sunt permise oricum) Atentie! "%d " : spatiu dupa numar consuma spatii pana la altceva! - un numar intre % si caracterul de format limiteaza caracterele citite %4d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) scanf("%d%d", &m, &n); scanf("%2d%2d", &m, &n); scanf("%d %d", &m, &n); scanf("%f", &x); scanf("%d%x", &m, &n); Programarea calculatoarelor Curs 8 12 34 m=12 n=34 12345 m=12 n=34 rest: 5 12 34 m=12 n=34 12 34 x=12 34 123a m=123 n=0xA Marius Minea Functii de intrare iesire Functii de intrare iesire %d: intreg zecimal cu semn %i: intreg zecimal, octal (0) sau hexazecimal (Ox, OX) %o: intreg in octal, precedat sau nu de 0 %u: intreg zecimal tara semn %x, %x: intreg hexazecimal, precedat sau nu de Ox, ox %c: orice caracter; nu sare peste spatii (doar " %c") %s: sir de caractere, pana la primul spatiu alb Se adauga ' 0' %a, %A, %e, %E, %f, %F, %g, %G: real (posibil cu exponent) %p: pointer, in formatul tiparit de printf %n: scrie in argument (int *) nr de caractere citite pana in prezent; nu citeste nimic; nu incrementeaza nr de campuri convertite atribuite %[•••]: sir de caractere din multimea indicata intre paranteze %[' •••]: sir de caractere exceptand multimea indicata intre paranteze caracterul procent Programarea calculatoarelor Curs 8 Marius Minea %d, %i: intreg zecimal cu semn %o: intreg in octal, tara 0 la inceput %u: intreg zecimal tara semn %x, %x: intreg hexazecimal, tara Ox ох; cu a-f pt %x, A-F pt %x %c: caracter %s: sir de caractere, pana la ' 0' sau nr de caractere dat ca precizie %f, %f: real tara exp ; precizie implicita 6 poz ; la precizie 0: tara punct %e, %E: real, cu exp ; precizie implicita 6 poz ; la precizie 0: tara punct %g, %g: real, ca %e, %E daca exp precizia; altfel ca %f Nu tipareste zerouri sau punct zecimal in mod inutil %a, %A: real hexazecimal cu exponent zecimal de 2: Oxh hhhhp±d %p: pointer, in format dependent de implementare (tipic: hexazecimal) %n: scrie in argument (int *) nr de caractere scrise pana in prezent; caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 10 Directivele de formatare pot avea optional si alte componente: % fanion dimensiune precizie modificator tip : *: campul este citit, dar nu e atribuit (e ignorat) (scanf) -: aliniaza valoarea la stanga, la dimensiunea data (printf) + : pune + inainte de numar pozitiv de tip cu semn (printf) spatiu', pune spatiu inainte de numar pozitiv de tip cu semn (printf) o: completeaza cu o la stanga pana la dimensiunea data (printf) hh: argumentul este char (la format diouxXn) char c; scanf("%hhd", &c);    intrare: 123, c = 123 pe 1 octet dar: char c; scanf("%c", &c);    intrare: 123, c = ’l’ (49 ASCii) h: argumentul este short (la format diouxXn), ex %hd 1: arg este long (format diouxXn), ex long n; scanf("%ld", &n); sau double (format aAeEfFgG), ѲХ double x; scanf ("%lf", &x); 11: argumentul este long long (la format diouxXn) l: argumentul este long double (la format aAeEfFgG) Programarea calculatoarelor Curs 8 Marius Minea : un numar intreg scanf: numarul maxim de caractere citit pentru argumentul respectiv printf: numarul minim de caractere pe care se scrie argumentul (aliniat la dreapta si completat cu spatii, sau conform modificatorilor) : doar in printf; punct urmat de un numar intreg optional (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale pentru Eef   cifre semnificative pentru Gg printf ("i%7 2f i", 15 234); i 15 231 2 zecimale, 7 caract total numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m ="ian"; printf ("% 3s" , m); (util pt sir neterminat in ’ 0’) in printf, in locul dimensiunii si sau preciziei poate apare * Atunci dimensiunea se obtine din argumentul urmator: printf ("% *s", max, s); scrie cel mult max caractere din sir Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire Functii de intrare iesire 12 Scriere de numere reale in diverse formate: printf("%f n", 1 0 1100);    0 000909 : 6 pozitii zecimale printf("%g n", 1 0 1100);    0 000909091 : 6 poz semnificative printf("%g n", 1 0 11000);    9 09091e-05 : 6 poz semnificative printf("%e n", 1 0);    1 000000e+00 : 6 cifre zecimale printf("%f n", 1 0);    1 000000 : 6 cifre zecimale printf("%g n", 1 0);    1 : fara punct zecimal, zerouri inutile printf("% 2f n", 1 009);    1 01: 2 cifre zecimale printf("% 2g n", 1 009);    1: 2 cifre semnificative Scriere de numere intregi in forma de tabel: printf("|%6d|", -12); | -12| printf("|% d|", 12); | 12| printf("|%-6d|", -12); 1-12 | printf("|%06d|", -12); |-00012| printf("|%+6d|", 12); | +12| Scriere pe total 20 de pozitii (printf returneaza nr de caractere scrise) int m, n, len = printf("%d", m); printf("%*d", 20-len, n); Programarea calculatoarelor Curs 8 Marius Minea - doua caractere separate de un singur spatiu (citit si ignorat cu %*1[ ]) char cl, c2; if (scanf("%c%*l[ ]%c", &cl, &c2) == 2) { * etc * }  - citirea unui intreg cu exact 4 cifre: unsigned nl, n2, x; if (scanf(" %n%4u%n", &nl, &x, &n2) == 1 && n2 - nl == 4)  * etc *  (%n numara caracterele citite; stocam contor in nl, n2, apoi scadem) - citeste verifica un cuvant care trebuie sa apara in intrare int nr=0; scanf ("http:  %n" , &nr); if (nr == 7) {  *apare, s-a citit tot*  }-else {  *nu ajunge la formatul %n, nr ramane cu val dinainte 0*  }  - ignora pana la (exclusiv) caracter anume (ex  n): scanf ("%* [in]"); Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf ("%d", &n) == 1) si nu doar if (scanf("%d", &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati si depasirea, folosind extern int errno; #include    declara errno + constante pt clase de erori if (scanf("%d", &x) == 1))    testam si resetam errno pt depasire if (errno == ERANGE) { printf ("numar prea mare"); errno = 0; }  Programarea calculatoarelor Curs 8 Marius Minea 30 noiembrie 2004 - Axiomele lui Hoare si rationamente Floyd-Hoare - Operatorul lui Dijkstra (weakest precondition) - Verificarea prin abstractie cu predicate Verificare formala Curs 8 Marius Minea - verificarea formala a avut primele succese practice pentru hardware - dar inceputurile: din formalizarea semanticii limbajelor de programare "an adequate basis for formal definitions of the meanings of programa [ ] in such a way that a rigorous standard is established for proofs" "if the initial values of the program variables satisfy the relation R±, the final values on completion will satisfy the relation R2 " - metoda: anotarea unui program (schema logica) cu asertiuni - introduce notiunile de : o formuia VC(P; Q) a i daca P e adevarat inainte de a executa c, atunci Q e adevarat la iesire, si pt un program + conditie initiala - foarte general: asertii exprimate in logica predicatelor de ordinul i - dezvolta reguli generale pt combinarea conditiilor de verificare si reguli specifice pentru diferitele tipuri de instructiuni - introduce explicit pentru rationamentele despre cicluri - trateaza cu ajutorul unei masuri pozitive descrescatoare Verificare formala Curs 8 Marius Minea - ca si Floyd, trateaza preconditii si postconditii pentru executia unei instructiuni, dar notatia de triplet Hoare pune mai clar in evidenta relatia dintre instructiune si cele doua asertiuni - lucreaza cu programe textuale, nu scheme logice - Notatie: {P} S {   => Q { } while E do S {Q} while (lo m)  * ambele cazuri mentin lo m => n >= m+1 => n >= lo *  else hi = m;  * !(n n n lo==n && n==hi *  Sa stabilim {P} * a? = 2 {v + *x = 4} Care este preconditia P ? Raspunsul corect: v = 2 v x = &cv Dar aplicarea regulii (v 4- *x = 4)[*a? 2] pierde cazul al doilea Trebuie sa modelam memoria, m = memorie, а = adresa, d = data Fie functiile rd(m, a) return d si wr(m, a, d) return mf , ч f d daca ao = a-t Avem regula: rd(wr(m, a-t ,d),a?) = wp(S,Q) - wp e un transformator de predicate (transforma post- in preconditie) - permite definirea unui calcul cu astfel de transformari Atribuire: wptx E,Q) — Q[x E] (v regula lui Hoare) Secventiere: wp(,S'i; sz, Q) — wptSi,wptSz,Q)) Conditional: wp(if E then 5'i else ,s'2, (?) = (E => wp(5'i, wp(Sz, Q (nu se intra in ciclu) wpi+1(whileEdo5", wp(S',wp)t(whileEdoS',Q))) л (-•E^-Q) ( o iteratie urmata de se poate scrie ca formula de punct fix Verificare formala Curs 8 Marius Minea Verificare formala Curs 8 Marius Minea Cunoastem P inainte de o bucla, dorim Q dupa executie Cum stabilim un invariant i al buclei pentru a demonstra Q? i trebuie sa satisfaca urmatoarele conditii: - P => i (i suficient de slab pt a fi stabilit) - {7 л E} S {7} (7 este un invariant) - 7 л ^E => Q (7 suficient de puternic pt a fi util) Stabilirea invariantilor e o problema dificila Exemplu trivial: {;r 10, dar nu asa de util) De regula: calcul iterativ, ca punct fix necesita uneori intarirea invariantului (strengthening) Verificare formala Curs 8 Marius Minea Formalismele de tip Floyd-Hoare permit exprimarea de proprietati ca predicate peste variabilele de stare ale programului - astfel am specificat de ex proprietatile in verificatorul Spin - exemple de predicate: x > 0, lock — 1, x + 1 E necesara o metoda (eventual aproximativa) pentru explorarea inainte   inapoi in spatiul abstract Verificare formala Curs 8 Marius Minea O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] Consta in: - un domeniu concret D si un domeniu abstract A, legate printr-o conexiune Galois: - o functie de abstractie а : D -"  A - o functie de concretizare 7 : A -"  P(Z>) (asociaza fiecarei valori abstracte o multime de valori concrete) - a i Var 6 iP(E) C 7(a(ar)) si Va 6 A a = ri(7(a)) (abstractizarea urmata de concretizare introduce aproximare; concretizarea urmata de abstractizare e exacta) Majoritatea abstractiilor pot fi reformulate in acest cadru general Verificare formala Curs 8 Marius Minea - lucram simbolic, cu multimi de stari reprezentate prin formule post(r,t) — {  | 3s 6 r s -4 s'}: succesorul regiunii (multimii de stari) r - cautam operatorul in spatiul abstract: post^tr,^ — a(postf( y( r'),t')') - in general, acest calcul nu poate fi   e costisitor de efectuat precis (in speta operatia de abstractizare a) => variante de abstractie cu predicate, in functie de aproximatia aleasa Verificare formala Curs 8 Marius Minea - fiecare predicat e reprezentat in forma canonica disjunctiva (ca si disjunctie de monoame ) monom — produs de predicate pi sau negatia lor -pi - succesorul post?(iibt) Pt tranzitia (instructiunea) t e aproximat tot printr-un monom => trebuie determinat pentru fiecare predicat  > daca posf''(' ’J) implica sigur pi sau -p, => adica, daca tb => wp(pj,t) sau tb => wp(^pj,t) - Limitarea la aproximatia succesorilor cu monoame e restrictiva => poate conduce la aproximari grosiere - Pe de alta parte, un calcul mai precis ar putea duce la un numar exponential de apeluri la proceduri de decizie => nefezabil - regiunea л^ргес(7(и,), t), pentru 1 e realizabil, si fals altfel Verificare formala Curs 8 Marius Minea Verificare formala Curs 8 Marius Minea - Variantele anterioare implica calculul al lui post1 pentru orice combinatie de predicate care apare in explorare -in cazul cel mai defavorabil, acest numar este - Solutie: separarea efectelor programului asupra fiecarui predicat => calculeaza o singura data pentru fiecare instructiune care e efectul ei posibil asupra predicatului pi => produce un program boolean abstract in care fiecare instructiune are ca efect atribuirea cu noi valori a fiecarui predicat - adevarat, daca starea dinainte implica іир(т(р;) і) - fals, daca starea dinainte implica и 7>(- (- > ), () - necunoscut, in caz contrar Exemplu: Proiectul SLAM [Microsoft Research] (Software (Specifications), Languages, Analysis and Model checking) Scopul: verificarea unor proprietati de siguranta (invariant!) concret: un program respecta regulile de utilizare APi (ex: apelurile la lockO si unlockO alterneaza - concentrat mai ales pe descoperirea erorilor de interfata - utilizat practic pentru device drivers in Windows NT XP Caracteristici: - nu necesita anotarea programului de catre utilizator (doar specificarea unor reguli sub forma de automat - monitor) - abstractia e rafinata automat, ghidata de contraexemplele gasite Verificare formala Curs 8 Marius Minea Verificare formala Curs 8 Marius Minea - Slic (Specification Language for interface Checking): specificarea unui automat care monitorizeaza executia pentru erori - C2bp: transforma programul P (scris in C) intr-un program boolean BP peste un set de predicate - Bebop: analizeaza spatiului starilor programului boolean; combina analiza interprocedurala a datelor cu reprezentari BDD rezulta in verificare sau contraexemplu - Newton: descopera automat noi predicate pentru analiza programului boolean, in functie de fezabilitatea contraexemplelor gasite: - un contraexemplu fezabil in programul original e raportat - daca nu, se elimina falsa cale de eroare prin rafinarea abstractiei - daca nu se poate decide, se solicita ajutorul utilizatorului do {  * Fragment de device driver, [Ball & Hajamani ’Ol] *  request = devExt->WriteListHeadVa; if(request ftft request->status) { devExt->WriteListHeadVa = request->Next; irp = request->irp; if (request->status > 0) { irp->ioStatus Status = STATUS-SUCCESS; irp->ioStatus information = request->Status; } else { irp->ioStatus Status = STATUSJiNSUCCESSFUL; irp->ioStatus information = request->Status; } SmartDevFreeBlock(request); loCompleteHequest(irp, i0 N0 iNCH MENT); } } Verificare formala Curs 8 Verificare formala Curs 8 Marius Minea Marius Minea state { enum { Unlocked=0, Locked=l } state = Unlocked; } KeAcquireSpinLock return { if (state == Locked) abort; else state = Locked; } KeReleaseSpinLock return { if (state == Unlocked) abort; else state = Unlocked; } Specificarea este tradusa in C si programul original este instrumentat (programul original corect <> programul instrumentat nu atinge eroare) Porneste de la predicatele din specificatie nondeterminism in control; skip pentru instructiuni irelevante; do { A: skip; if (*) { B: if (*) { skip; } else { skip; } } } C: Verificare formala Curs 8 Marius Minea Verificare formala Curs 8 Marius Minea Bebop: calculeaza multimea starilor atinse pentru fiecare instructiune dintr-un program boolean, folosind un algoritm de analiza a fluxului de date (dataflow analysis) interprocedural stare — atribuire pentru variabilele din domeniul de vizibilitate multime de stari — functie booleana, reprezentata prin BDD calculul cu multimi de stari: captureaza corelarile intre variabile - nu expandeaza procedurile, exploateaza localitatea variabilelor - foloseste un graf de control explicit - complexitate: liniara in graful de control, exponentiala in nr de variabile vizibile intr-un punct de program Pentru exemplul dat: se semnaleaza eroare, se poate parcurge A: KeAcquireSpinLockO de doua ori succesiv Verificare formala Curs 8 Marius Minea Se foloseste un demonstrator de teoreme si un generator de conditii de verificare pentru a stabili daca contraexemplul in programul abstract reprezinta un contraexemplu in programul concret Evalueaza instructiunile programului folosind constante simbolice, pana cand demonstratorul de teoreme determina fie ca atribuirea la sfarsitul traiectoriei este fezabila, fie gaseste o inconsistenta pe parcurs Daca se gaseste o inconsistenta, se cauta una minimala si se genereaza predicatele corespunzatoare in exemplu: nPacketsOld = nPackets si nPacketsOld 1= nPackets procedurile de decizie sunt incomplete => poate returna "nu stiu" pt fiecare instructiune, se determina daca poate afecta vreun predicat analiza modulara pt proceduri, analiza de aliasuri pt pointeri, etc Verificare formala Curs 8 Marius Minea do { A:  * b == (nPackets == nPacketsOld) *  if (*) { B: if (*) { skip; } else { skip; }  * chooseCpl, p2) == pl ? T : p2 ? F : nondet *  } } C: - in prezent: se pot analiza programe de cca lOkloc si cateva sute de variabile boolene in cateva (zeci de) minute - se estimeaza ca prin optimizari se poate ajunge la cca lOOkloc Optimizare: lazy abstradion [Henzinger, Jhala, Majumdar, Sutre, Berkeley'02] - nu se recreaza abstractia la fiecare iteratie - abstractia curenta este rafinata cu predicatele noi => rafinata doar in fragmentele unde este necesar (on-the-fly) => se pastreaza localitatea (ex abstractii diferite pentru diferitele ramuri de control) Abstractia obtinuta este suficienta pentru a demonstra corectitudinea Verificare formala Curs 8 Marius Minea Verificare formala Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire Programarea calculatoarelor Curs 8 Marius Minea 15 aprilie 2008 Marius Minea char *fgets(char *s, int size, FiLE *stream) ;   deci, in stdio h Citeste pana la (si inclusiv) linie noua  n, dar max size-1 caractere pune linia in taPloul s, adauga > 0’ la sfarsit Exemplu: char tab[80J; fgets(tab, 80, stdin); Parametrul al treilea: un fisier (discutam ulterior); pentru a citi de la intrarea standard, folosim identificatorul stdin (din stdio h) fgets returneaza null daca n-a citit nimic (sfarsit de fisier) la succes: returneaza chiar adresa primita parametru (deci nenula) =s Testam de rezultat nenul pentru a sti daca s-a citit cu succes: Exemplu: citire + afisare linie cu linie pana la sfarsitul intrarii char s[81J; while (fgets(s, 81, stdin)) printf ("7 s", s) ; liniile mai lungi de 80 de caractere se citesc afiseaza pe bucati NU folositi functia gets ! Nu se poate specifica lungimea maxim disponibila =s se poate depasi zona de memorie alocatai =s program abandonat, corupere de memorie, vulnerabilitati de securitate Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire Programarea calculatoarelor Functii de intrare iesire int printf(const char* format,    tiparire formatata restul parametrilor: de tiparit (orice ) returneaza: nr de caractere tiparite; specificatori de format: 7 c char, 7 d decimal, 7 f float, 7 p pointer, 7 s sir, 7 u unsigned, 7 x heXa int scanf(const char* format, );    citire formatata restul parametrilor: variabilelor de citit Exemple: int n; scanf ("7 d", &n) ; float a ; scanf ("7 f", &a[2J); Format: ca printf, cu unele diferente Ex 7 f float, 7 1f double returneaza: variabilelor citite (atribuite) (NU valoarea!), sau EOF daca apare o eroare de intrare inalnte de citirea primei variabile =s folosim rezultatul pentru a testa daca s-au citit cele dorite: int n; if (scanf ( "7 d", &n)==l) { * s-a citit* } else { * eroare * } Utilizatorul poate introduce orice si oricat =s la orice citire (fgets, getchar, scanf etc ) ! Programarea calculatoarelor Curs 8 Marius Minea Pe langa specificatori, sirul de format poate avea la printf: se tiparesc; la scanf: unsigned z, 1, a; scanf ("7 U 7 U 7 U", &z, &1, &a) ;    15 4 2008 cu scanf citeste pana cand intrarea formatului, apoi revine Restul variabilelor nu se atribuie; caracterele necitite raman in intrare Exemplu: int x, y; intrare: 123A scanf ("7 d7 d", &x, &y); returneaza 1; x = 123, y: necitit; ramas: A scanf ("7 d7 x", &x, &y); returneaza 2; x = 123, y: OxA (10) =s trebuie inainte de a solicita din nou date int m, n; printf("introduceti doua numere: "); while (scanf("%d%d", &m, &n) != 2) {    cat timp nu e corect while (getcharO ! =    consuma restul liniei printf("mai incercati o data: "); }    acum putem folosi m si n Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 5 Programarea calculatoarelor Functii de intrare iesire Citirea unui caracter: char c; scanf ("7 c", &c); testati rezultatul (1?) Mai Simplu: int c = getchar; if (c != EOF)    are valoare de char Citirea mai multor caractere: intr-un tablou (sir), in limitele acestuia: - un char s ; scanf ( "7 80c " , s) ; orice caractere, inclusiv spatii albe; NU adauga > 0’ la sfarsit - un (orice pana la spatiu alb) char s[801; scanf ("7 79s", s); consuma si ignora spatii albe initiale; adauga > 0’ la sfarsit - sir dintr-o 7 [ 1 char a ; scanf ("7 32 [A-Za-z ] " , a); max 32 litere sau - sir 7 [- 1 char t ", t); max 80, pana la cifra , sau Numele de tablou , nu mai trebuie pus & E intre 7 si s [] ["] (-1 fata de tablou, pt > 0’) lipsa e o =s corupere de memorie, atacuri de securitate Formatul Citeste cuvant (pana spatii), nu linie! Formatul NU e Hs-Programarea calculatoarelor Curs 8 Marius Minea - formatele si consuma (sar peste) spatii albe initiale "7 d7 d" doi intregi separati si eventual precedati de spatii albe - formatele c [ ] [" ] nu sar peste spatii albe; ele nu au rol special - un spatiu alb in sirul de format consuma oricate spatii albe din intrare scanf (" "); consuma toate spatiile albe pana la primul alt caracter "7 c 7 c" citeste caracter arbitrar, consuma spatii, citeste alt caracter "7 d 7 f" acelasi efect ca "7 d7 f" (spatiile sunt permise oricum) Atentie! "7 d " : dupa numar consuma spatii pana la altceva! - un numar intre 7 si caracterul de format limiteaza caracterele citite 7 4d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) scanf ("7 d7 d" , &m, &n) ; scanf ("7 2d7 2d", ton, &n) ; scanf ("7 d ,7 d" , &m, &n) ; scanf ("7 f", &x) ; scanf ("7 d7 x" , &m, &n) ; Programarea calculatoarelor Curs 8 12 34 m=12 n=34 12345 m=12 n=34 rest: 5 12 34 m=12 n=34 12 34 x=12 34 123a m=123 n=0xA Marius Minea Programarea calculatoarelor Functii de intrare iesire Programarea calculatoarelor Functii de intrare iesire 7 d: intreg zecimal cu semn 7 i: intreg zecimal, octal (0) sau hexazecimal (Ox, ox) 7 o: intreg in octal, precedat sau nu de 0 7 u: intreg zecimal tara semn 7 x, 7 x: intreg hexazecimal, precedat sau nu de Ox, ox 7 c: orice caracter; nu sare peste spatii (doar " 7 C) 7 s: sir de caractere, pana la primul spatiu alb Se adauga ' 0' 7 a, 7 A, 7 e, 7 E, 7 1, 7 F, 7 g, 7 G: real (posibil cu exponent) 7 p: pointer, in formatul tiparit de printf 7 n: scrie in argument (int *) nr de caractere citite pana in prezent; nu citeste nimic; nu incrementeaza nr de campuri convertite atribuite 7 [• • •]: sir de caractere din multimea indicata intre paranteze 7 [" - J: sir de caractere exceptand multimea indicata intre paranteze 7 7 : caracterul procent 7 d, 7 i: intreg zecimal cu semn 7 o: intreg in octal, tara 0 la inceput 7 u: intreg zecimal tara semn 7 x, 7 x: intreg hexazecimal, tara Ox ох; cu a-f pt 7 x, A-F pt 7 x 7 c: caracter 7 s: sir de caractere, pana la ' 0' sau nr de caractere dat ca precizie 7 f, 7 F: real fara exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7 e, 7 E: real, cu exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7 g, 7 G: real, ca 7 e, 7 E daca exp precizia; altfel ca 7 f Nu tipareste zerouri sau punct zecimal in mod inutil 7 a, 7 A: real hexazecimal cu exponent zecimal de 2: ОхЛ hhhht±d 7 p: pointer, in format dependent de implementare (tipic: hexazecimal) 7 n: scrie in argument (int *) nr de caractere scrise pana in prezent; 7 7 : caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire Programarea calculatoarelor Functii de intrare iesire 10 Directivele de formatare pot avea optional si alte componente: 7 fanion dimensiune precizie modificator tip : *: campul este citit, dar nu e atribuit (e ignorat) (scanf) -: aliniaza valoarea la stanga, la dimensiunea data (printf) +: pune + inainte de numar pozitiv de tip cu semn (printf) spatiu', pune spatiu inainte de numar pozitiv de tip cu semn (printf) o: completeaza cu o la stanga pana la dimensiunea data (printf) hh: argumentul este char (pt diouxXn) char c; scanf ("7 hhd", &c) ;    intrare: 123, c = 123 pe 1 octet dar: char c; scanf ("7 c", &c) ;    intrare: 123, c = ’l’ (49 ASCii) h: argumentul este short (pt diouxXn), ex 7 hd 1: arg este long (pt diouxXn), ex long n; scanf ("7 1d", &n) ; sau double (pt aAeEfFgG), ex double x; scanf ("7 1f", &x) ; 11: argumentul este long long (pt diouxXn) l: argumentul este long double (pt aAeEfFgG) Programarea calculatoarelor Curs 8 Marius Minea : un numar intreg scanf: numarul maxim de caractere citit pentru argumentul respectiv printf: numarul minim de caractere pe care se scrie argumentul (aliniat la dreapta si completat cu spatii, sau conform modificatorilor) : doar in printf; punct urmat de un numar intreg optional (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale pentru Eef   cifre semnificative pentru Gg printf (" 17 7 2f | ", 1Б 234); | 15 231 2 zecimale, 7 caract total numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m = "ian"; printf ("7 3s" , m) ; (util pt sir neterminat in > 0’) in printf, in locul dimensiunii si sau preciziei poate apare * Atunci dimensiunea se obtine din argumentul urmator: printf ("7 *s", max, s); scrie cel mult max caractere din sir Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire Programarea calculatoarelor Functii de intrare iesire 12 Scriere de numere reale in diverse formate: printf("%f n", 1 0 1100);    0 000909 : 6 pozitii zecimale printf("%g n", 1 0 1100);    0 000909091 : 6 poz semnificative printf("%g n", 1 0 11000);    9 09091e-05 : 6 poz semnificative printf("%e n", 1 0);    1 000000e+00 : 6 cifre zecimale printf("%f n", 1 0);    1 000000 : 6 cifre zecimale printf("%g n", 1 0);    1 : fara punct zecimal, zerouri inutile printf("% 2f n", 1 009);    1 01: 2 cifre zecimale printf("% 2g n", 1 009);    1: 2 cifre semnificative Scriere de numere intregi in forma printf("|%6d|", -12); | -12| printf("|%-6d|", -12); 1-12 | printf("|%+6d|", 12); | +12| de tabel: printf("|% d|", 12); | 12| printf("|%06d|", -12); 1-000121 Scriere pe total 20 de pozitii (printf returneaza nr de caractere scrise) int m, n, len = printf("%d", m); printf("%*d", 20-len, n); Programarea calculatoarelor Curs 8 Marius Minea - doua caractere separate de un singur spatiu (citit si ignorat cu %*1 [ ]) char cl, c2; if (scanf("%c%*l[ ]%c", &cl, &c2) == 2) { * etc * } - citirea unui intreg cu exact 4 cifre: unsigned nl, n2, x; if (scanf(" %n%4u%n", &nl, &x, &n2) == 1 && n2 - nl == 4)  * etc *  (%n numara caracterele citite; stocam contor in nl, n2, apoi scadem) - citeste verifica un cuvant care trebuie sa apara' in intrare int nr=0; scanf("http:  %n", &nr); if (nr == 7) {  *apare, s-a citit tot*  } else {  *nu ajunge la formatul %n, nr ramane cu val dinainte 0*  } - ignora pana la (exclusiv) caracter anume (ex  n): scanf ("‘ ,*P n]"); Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf("%d", &n) == 1) si nu doar if (scanf("%d", &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati si depasirea, folosind extern int errno; #include    declara errno + constante pt clase de erori if (scanf("%d", &x) == 1))    testam si resetam errno pt depasire if (errno == ERANGE) { printf("numar prea mare"); errno = 0; } Programarea calculatoarelor Curs 8 Marius Minea Tipuri definite de utilizator 4 decembrie 2003 Un tip defineste o multime de valori si operatiile posibile cu acestea Adeseori e nevoie de alte tipuri (mai complexe) decat cele de baza, in C se pot defini tipuri enumerare, structura si uniune cu sintaxa: cuvantcheie opinurne tip specificatie tip opt lista declaratori ; unde cuvant cheie ::= enum | struct | union opt nume tip: pt referire ulterioara (prefixat cu enum, struct, union) optJistaodeclaratori: pot fi declarate obiecte de tipul respectiv - opt nume tip e intr-un spatiu de nume diferit de cel comun pentru variabile, tipuri si functii E mai clar sa folosim totusi nume diferite Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: enum opinurne tip { lista constante } opt lista declaratori ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - acelasi nume de constanta nu poate fi folosit in doua enumerari diferite - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante int ore lucru[Z]; enum zile sapt {D, L, Ma, Mc, J, V, S} zi; for (zi = L; zi e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume cainp Operatorii si -> au precedenta cea mai ridicata, ca si O si [] Atentie la ordinea de evaluare i p->x++ inseamna (p->x)++ ++p->x inseamna ++(p->x) *p->x inseamna *(p->x) *p->s++ inseamna *((p->s)++) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume lunaC12] = { "ianuarie", , "decembrie" }; char zile luna = { 31, 28, 31, 30, , 30, 31 };  * e preferabila varianta urmatoare *  typedef struct { char *nume; int zile; } tip luna; tip luna luni = { {"ianuarie", 31}, , {"decembrie", 31} }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator 10 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {  *o lista de cuvinte *  char *word;  * informatia propriu-zisa *  struct wl *next;  * pointer la acelasi tip de structura *  }; Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  * declaratie incompleta *  struct t { int val; tree *left, *right;  * foloseste numele din typedef *  }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Se pot declara campuri intregi cu un numar specificat de biti => Testarea setarea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : int-const ; | : int-const ; struct packet { int : 2;  * primii doi biti nu intereseaza *  int error: 1;  * un bit, semnalizeaza eroare *  int status: 3;  * un camp pe 3 biti *  int : 0;  * forteaza alinierea la octetul urmator *  int seq no: 4;  * numar de secventa pe 4 biti *  } pkt; if (pkt error) { } else if (pkt status == 5) { } else pkt seq no++; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 11 Tipuri definite de utilizator 12 Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { iista c3mpuri } opt lista declaratori ; Lista de campuri este insa o lista de variante: - o variabila structura contine toate campurile declarate - o variabila uniune contine exact una din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune nu contine informatii despre varianta reprezentata - acest lucru trebuie memorat explicit in program (in alta variabila) Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) - date suplimentare pentru identificatori (nume) si constante (valoare) enumtok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , COMMa, }; typedef union { char *id;  * sir de caractere pentru identificator *  int ival;  * valoare pentru constanta intreaga *  float fval;  * valoare pentru constanta reala *  } lexvalue; enum tok token; lexvalue iv; switch (token) { case iDENT: printf("%s", iv id); break; case iNUM: printf("%d", iv ival); break; case FNUM: printf("%f", iv fval); break; } Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Utilizarea si programarea calculatoarelor Curs 6 Marius Minea 19 noiembrie 2012 Orice variabila x de tipul tip are o de tipul = adresa la care e memorata valoarea (continutul) variabilei Adresa e o valoare numerica, dar nu e un int   unsigned Se poate tipari cu printf, formatul %p Adresele sunt nenule Valoarea (0) indica o adresa invalida Discutam: 1 Cum o variabila pointer (de tip adresa) 2 Cum o valoare de tip pointer (adresa) 3 Cum si la ce un pointer (o adresa) tip *nume var; => пите-var poate contine adresa unei valori de tipul tip Exemplu: char *s; int *p; Cand declaram mai multi pointeri, apare la int *p, *q; int *p, q; declara doi pointeri la intregi declara un pointer p si un intreg q e un pointer: int tab , *a = tab; sau: int tab ; int *a; a = tab; produce un pointer: int n, *p = &n; sau: int n; int *p; p = &n; 0 are tip pointer: char *s = "test"; sau: char *s; s = "test"; operator prefix operand: pointer; rezultat: (variabila) indicat de pointer *p poate fi folosit la dreapta unei atribuiri sau la stanga (eng ), ca o variabila (sau element de tablou) daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, у, *p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) Puterr citi tip * p; Variabila Valoare Adresa tip * p; p are tipul tip * int x = 5; 5 0x408 tip *p; *p are tipul tip int *p=&x; 0x408 0x51C char adresa de adr de char char *t ; tab de 8 adr de char int **pp=&p; 0x5 iC 0x9D0 0 cu NU este o i int t = { 3, 5 }; initializeaza t Gresit: t - { 3, Б }; int x, *p = &x; e la fel ca int x; int *p; p = &x; (e initializat atribuit p, NU *p) *p - &x e gresit ca tip! char *p = "sir"; e char *p; p = "sir"; Gresit: *p   "sir; O functie о variabila transmisa ca parametru r sa-i valoarea: = *p; Cu pa unei variabile putem: " sa valoarea: *p = ; Primind o , o functie la ea o valoare (ca scanf) void swap (int *pa, int *pb) {    schimba valori de la 2 adrese int tmp;    var temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim de functii: ca sa transmitem (in C nu putem transmite continutul) pentru a intoarce (return permite doar una) ex minimul maximul unui tablou; rezultat cod de eroare 14 aprilie 2009 Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 2 char *fgets(char *s, int size, FiLE *stream);   deci, in stdio h Citeste pana la (si inclusiv) linie noua  n, dar max size-1 caractere pune linia in tabloul s, adauga ’ 0’ la sfarsit Exemplu: char tab ; fgets(tab, 80, stdin); Parametrul al treilea: un (discutam ulterior); pentru a citi de la , folosim identificatorul (din stdio h) fgets returneaza daca n-a citit nimic (sfarsit de fisier) la succes: returneaza chiar adresa primita parametru (deci nenula) => Testam de rezultat nenul pentru a sti daca s-a citit cu succes: Exemplu: citire + afisare linie cu linie pana la sfarsitul intrarii char s ; while (fgets(s, 81, stdin)) printf ("° os", s) ; liniile mai lungi de 80 de caractere se citesc afiseaza pe bucati NU folositi functia gets ! Nu se poate specifica lungimea maxim disponibila => se poate depasi zona de memorie alocata! => program abandonat, corupere de memorie, vulnerabilitati de securitate Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 3 int printf(const char* format,    tiparire formatata returneaza: nr de caractere tiparite; in format: specificatori 7oC char, ° od decimal, ° of float, ° op pointer, ° os sir, ° ou unsigned, ° ox heXa restul parametrilor: de tiparit (orice ) int scanf(const char* format,    citire formatata restul parametrilor: variabilelor de citit: (mai putin la siruri) Exemple: int n; scanf ("° od", &n); float a ; scanf ("° of", &a ); Format: ca printf, cu unele diferente Ex ° of float, ° olf double returneaza: variabilelor citite (atribuite) (NU valoarea!), sau EOF daca apare o eroare de intrare inainte de citirea primei variabile => folosim rezultatul pentru a testa daca s-au citit cele dorite: int n; if (scanf ("° od", &n)==l) { * s-a citit* } else { * eroare * } Utilizatorul poate introduce orice si oricat => la orice citire (fgets, getchar, scanf etc ) ! Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 4 Pe langa specificatori, sirul de format poate avea la printf: se tiparesc; la scanf: unsigned z, 1, a; scanf ("° ou ° ou ° ou", &z, &1, &a) ;    15 4 2008 cu scanf citeste pana cand intrarea formatului, apoi revine Restul variabilelor nu se atribuie; caracterele necitite raman in intrare scanf ("7odo od", &x, &y); in: 123A ret 1; x = 123, y: necitit; ramas: A scanf ("7odo ox", &x, &y) ; in: 123A ret 2; x = 123, у = OxA (10) La eroare trebuie inainte de a solicita din nou date: int m, n; printf("introduceti doua numere: "); while (scanf ("7od7od", &m, &n) != 2) {    cat timp nu e corect while (getcharO != ’ n’);    consuma restul liniei printf("mai incercati o data: "); }    acum putem folosi m si n Tipar uzual: while (citit bine) prelucreaza : while (fgets( )) while ((c = getcharO) != EOF) while (scanf ( ) == cate-cer) Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 5 Citirea unui caracter: char c; scanf ("° oc", &c); testati rezultatul (1?) Mai simplu: int c = getcharO; if (c ! = EOF)    valoare de char Citirea mai multor caractere: intr-un tablou (sir), in limitele acestuia: - un (orice pana la spatiu alb) char t ; scanf ("° 032s", t); consuma si ignora spatii albe initiale; adauga ’ 0’ la sfarsit - un : char tab ; scanf ("° 080c", tab) ; orice caractere, inclusiv spatii albe; NU adauga ’ 0’ la sfarsit - sir dintr-o (- pt intervale) ° 0 [ ] char a ; scanf ("° 032 [A-Za-z ] " , a); max 32 litere sau - sir % i? ] char t ; scanf ("7o8O [ , 0-9]", t); max 80, pana la cifra , sau Numele de tablou , nu mai trebuie pus & E intre % si s [] [ ] (-1 fata de tablou, pt ’ 0’) lipsa e o => corupere de memorie, atacuri de securitate Formatul citeste cuvant (pana spatii), nu linie! Formatul NU e Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 6 - formatele si consuma (sar peste) spatii albe initiale "7odo od" doi intregi separati si eventual precedati de spatii albe - formatele c [ ] ] nu sar peste spatii albe; ele nu au rol special - un in sirul de format consuma oricate spatii albe din intrare scanf (" "); consuma toate spatiile albe pana la primul alt caracter "7oC 7oc" citeste caracter arbitrar, consuma spatii, citeste alt caracter "° od ° of" acelasi efect ca "70d° 0f" (spatiile sunt permise oricum) Atentie! "7od " : spatiu dupa numar consuma spatii pana la altceva! - un numar intre 7o si caracterul de format limiteaza caracterele citite 7o4d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) scanf ("7od7od" , &m, &n) ; scanf ("7o2d7o2d" , &m, &n) ; scanf ("7od 70d" , &m, &n) ; scanf ("7of", &x) ; scanf ("7od7oX" , &m, &n) ; 12 34 m=12 n=34 12345 m=12 n=34 rest: 5 12 34 m=12 n=34 12 34 x=12 34 123a m=123 n=0xA Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 7 ° od: intreg zecimal cu semn 7oi: intreg zecimal, octal (0) sau hexazecimal (Ox, ox) ° oo: intreg in octal, precedat sau nu de 0 ° ou: intreg zecimal fara semn ° oX, ° oX: intreg hexazecimal, precedat sau nu de Ox, ox ° oc: orice caracter; nu sare peste spatii (doar " ° oc") ° os: sir de caractere, pana la primul spatiu alb Se adauga ’ 0’ ° oa, ХА, ° oe, ХЕ, ° of, ° 0F, ° og, ° 0G: real (posibil cu exponent) ° op: pointer, in formatul tiparit de printf ° on: scrie in argument (int *) nr de caractere citite pana in prezent; nu citeste nimic; nu incrementeaza nr de campuri convertite atribuite %[•••]: sir de caractere din multimea indicata intre paranteze • •]: sir de caractere exceptand multimea indicata intre paranteze ’ o’Z: caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 8 7"d, 70i: intreg zecimal cu semn 7"o: intreg in octal, fara 0 la inceput 7ou: intreg zecimal fara semn 7 x, 7 x: intreg hexazecimal, fara 0x 0X; cu a-f pt 7 x, A-F pt 7 x 7"c: caracter 7"s: sir de caractere, pana la ’ O’ sau nr de caractere dat ca precizie 7"f, 7"F: real fara exp ; precizie implicita 6 poz ; la precizie O: fara punct 7"e, 7"E: real, cu exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7"g, 7 G: real, ca 7"e, 7 E daca exp precizia; altfel ca 7"f Nu tipareste zerouri sau punct zecimal in mod inutil 7"a, 7 A: real hexazecimal cu exponent zecimal de 2: Ox i hhhhp±d 70p: pointer, in format dependent de implementare (tipic: hexazecimal) 7oii: scrie in argument (int *) nr de caractere scrise pana in prezent; 7 7 : caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 9 Directivele de formatare pot avea optional si alte componente: % fanion dimensiune precizie modificator tip : *: campul este citit, dar nu e atribuit (e ignorat) aliniaza valoarea la stanga, la dimensiunea data +: pune + inainte de numar pozitiv de tip cu semn spatiu', pune spatiu inainte de numar pozitiv de tip cu semn 0: completeaza cu 0 la stanga pana la dimensiunea data (scanf) (printf) (printf) (printf) (printf) hh: argumentul este char (la format diouxXn) char c; scanf ("° ohhd", &c) ;    intrare: 123, c = 123 pe 1 octet dar: char c; scanf ("° oc", &c) ;    intrare: 123, c = ’ 1’ (49 ASCii) h: argumentul este short (la format diouxXn), ex ° ohd 1: arg este long (format diouxXn), ex long n; scanf ("° old", &n) ; sau double (format aAeEfFgG), ex double x; scanf ("° olf" , &x) ; 11: argumentul este long long (la format diouxXn) L: argumentul este long double (la format aAeEfFgG) Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 10 : un numar intreg scanf: numarul maxim de caractere citit pentru argumentul respectiv printf: numarul minim de caractere pe care se scrie argumentul (aliniat la dreapta si completat cu spatii, sau conform modificatorilor) : doar in printf; punct urmat de un numar intreg optional (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale pentru Eef   cifre semnificative pentru Gg printf (" |° 07 2f i", 15 234); i 15 23І 2 zecimale, 7 caract total numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m ="ian"; printf ("° 0 3s", m) ; (util pt sir neterminat in ’ 0’) in printf, in locul dimensiunii si sau preciziei poate apare * Atunci dimensiunea se obtine din argumentul urmator: printf ("° 0 *s", max, s); scrie cel mult max caractere din sir Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 11 Scriere de numere reale in diverse formate: 1 0 1100); 1 0 1100); 1 0 11000); 1 0); printf ("° 0 2f n" , 1 009);    0 000909 : 6 pozitii zecimale    0 000909091 : 6 poz semnificative    9 09091e-05 : 6 poz semnificative    1 000000e+00 : 6 cifre zecimale    1 000000 : 6 cifre zecimale 1 : fara punct zecimal, zerouri inutile    1 01: 2 cifre zecimale printf ("° 0 2g n" , 1 009);    1: 2 cifre semnificative Scriere de numere intregi in forma de tabel: printf (" | ° o6d | " , -12); printf (" | ° o"6d | " , -12); printf (" | ° o+6d | " , 12); i -12| 1-12 | i +12| printf (" Г o d| ", 12) ; printf (" | ° oO6d | " , -12); i 12| i-00012| Scriere pe total 20 de pozitii (printf returneaza nr de caractere scrise) int m, n, len = printf ("° od" , m) ; printf ("° 0*d" , 20-len, n) ; Programarea calculatoarelor Curs 8 Marius Minea Functii de intrare iesire 12 - doua caractere separate de un singur spatiu (citit si ignorat cu ° 0*l [ ]) char cl, c2; if (scanf ("70c70*l [ ]7oC", &cl, &c2) == 2) { * etc * } - citirea unui intreg cu exact 4 cifre: unsigned nl, n2, x; if (scanf (" 7оп7о4и7оп", &nl, &x, &n2) == 1 && n2 - nl == 4)  * etc *  (7on numara caracterele citite; stocam contor in nl, n2, apoi scadem) - citeste verifica un cuvant care trebuie sa apara in intrare int nr=0; scanf ("http:  7оП", &nr); if (nr == 7) {  *apare, s-a citit tot*  } else {  *nu ajunge la formatul 70n, nr ramane cu val dinainte 0*  } - ignora pana la (exclusiv) caracter anume (ex  n): scanf ("7o*[  n]"); Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf ("7od" , &n) == 1) si nu doar if (scanf ("7od" , &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati si depasirea, folosind extern int errno; #include    declara errno + constante pt clase de erori if (scanf ("7od", &x) == 1))    testam si resetam errno pt depasire if (errno == ERANGE) { printf("numar prea mare"); errno = 0; } Programarea calculatoarelor Curs 8 Marius Minea 30 noiembrie 2004 - Axiomele lui Hoare si rationamente Floyd-Hoare - Operatorul lui Dijkstra (weakest precondition) - Verificarea prin abstractie cu predicate Verificare formala Curs 8 Marius Minea - verificarea formala a avut primele succese practice pentru hardware - dar inceputurile: din formalizarea semanticii limbajelor de programare "an adequate basis for formal definitions ofthe meanings of programs [ ] in such a way that a rigorous standard is established for proofs" "if the initial values of the program variables satisfy the relation Rlf the final values on completion will satisfy the relation R2'' - metoda: anotarea unui program (schema logica) cu asertiuni - introduce notiunile de : o formuia VC(P  Q) a i daca P e adevarat inainte de a executa c, atunci Q e adevarat la iesire, si pt un program + conditie initiala - foarte general: asertii exprimate in logica predicatelor de ordinul i - dezvolta reguli generale pt combinarea conditiilor de verificare si reguli specifice pentru diferitele tipuri de instructiuni - introduce explicit pentru rationamentele despre cicluri - trateaza cu ajutorul unei masuri pozitive descrescatoare Verificare formala Curs 8 Marius Minea - ca si Floyd, trateaza preconditii si postconditii pentru executia unei instructiuni, dar notatia de triplet Hoare pune mai clar in evidenta relatia dintre instructiune si cele doua asertiuni - lucreaza cu programe textuale, nu scheme logice - Notatie: {P} S {Q} Daca S e executat intr-o stare care satisface F, si executia lui S se termina, starea rezultanta satisface Q - Ulterior: rationamente similare pt [F] S [Q] Daca S e executat intr-o stare care satisface F, atunci executia lui S se termina, si starea rezultanta satisface Q Aplicatie riguroasa: C A R Hoare Proof of a Program: FiND (1971) Verificare formala Curs 8 Marius Minea - sunt definite pentru fiecare tip de instructiune in parte; prin combinatia lor, se poate rationa despre programe intregi : -—-—-—— -—- unde Q[x E  e substitutia lui x cu E in Q {Q[x EJ} x := E {Q} Ex: {x = у - 2} x := x + 2 {x = y} (in rezultat, x = y, substituim x cu expresia atribuita, x + 2 si obtinem x + 2 = y, deci x = у - 2) Obs: scrierea ‘inapoi" a regulii (F in functie de Q) simplifica exprimarea {F} Si {Q} {Q} S2 {Д} {P}S1;S2{R} {P Л E} Si {Q} {P Л ^E} S2 {Q} {F} if E then Si else S2 {Q} Verificare formala Curs 8 Marius Minea (initial): cheia in rationamentul despre programe - trebuie gasit un i = o proprietate mentinuta adevarata de fiecare executie a ciclului (exprimata in punctul dintre iteratii) - daca intram in ciclu (ІГ), invariantul e mentinut dupa o iteratie S - daca nu mai intram (-lE), invariantul implica concluzia Q {i A E} S {1} i A^E^Q {1} while E do S {Q} while (lo m)  * ambele cazuri mentin lo m => n >= m+1 => n >= lo *  else hi = m;  * !(n n n lo==n && n==hi *  Verificare formala Curs 8 Marius Minea Sa stabilim {F} * x = 2 {v + *x = 4} Care este preconditia P ? Raspunsul corect: v = 2 v x = & v Dar aplicarea regulii (v + *x = 4)[*ж 2] pierde cazul al doilea Trebuie sa modelam memoria, m = memorie, a = adresa, d = data Fie functiile rd(m,a) return d si wr(m,a, wp(S, Q) - wp e un transformator de predicate (transforma post-in preconditie) - permite definirea unui calcul cu astfel de transformari Verificare formala Curs 8 Marius Minea Atribuire: wp(x := E, Q) = Q[x E] (v regula lui Hoare) Secventiere: wp(Si, S2,Q) = wp(Si,wp(S2,Q)) Conditional: wp(if E then Si else S2,Q) = (E wp(Si,Qy) л (->E => wp(S2,Q)) Pentru iteratie e nevoie de un calcul recursiv Definim wpk, in ipoteza ca bucla se termina in cel mult к iteratii: wpo(while E do S,Q) = - Q (nu se intra in ciclu) wp , l i(while-E do S, Q)) = (E =>wp(S, wpk(while E do S, Q))) л (-' ?^>Q) ( se poate scrie ca formula de punct fix Verificare formala Curs 8 Marius Minea Cunoastem P inainte de o bucla, dorim Q dupa executie Cum stabilim un invariant i al buclei pentru a demonstra Q? i trebuie sa satisfaca urmatoarele conditii: - P => i (i suficient de slab pt a fi stabilit) - {i   E} S {1} (i este un invariant) - i Л => Q (i suficient de puternic pt a fi util) Stabilirea invariantilor e o problema dificila Exemplu trivial: {x 10, dar nu asa de util) De regula: calcul iterativ, ca punct fix necesita uneori intarirea invariantului (strengthening) Verificare formala Curs 8 Marius Minea Formalismele de tip Floyd-Hoare permit exprimarea de proprietati ca predicate peste variabilele de stare ale programului - astfel am specificat de ex proprietatile in verificatorul Spin - exemple de predicate: x > 0, lock = 1, x + 1 E necesara o metoda (eventual aproximativa) pentru explorarea inainte   inapoi in spatiul abstract Verificare formala Curs 8 Marius Minea O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] Consta in: - un domeniu concret D si un domeniu abstract A, legate printr-o conexiune Galois  - o functie de abstractie a : D A — o functie de concretizare 7 : (asociaza fiecarei valori abstracte o multime de valori concrete) — a i   x G PCD) x С 7(а(ж)) si Va G A a = 0(7 (a)) (abstractizarea urmata de concretizare introduce aproximare; concretizarea urmata de abstractizare e exacta) Majoritatea abstractiilor pot fi reformulate in acest cadru general Verificare formala Curs 8 Marius Minea - lucram simbolic, cu multimi de stari reprezentate prin formule post(r,t) = {s' | 3s e r s -+ s'}: succesorul regiunii (multimii de stari) r - cautam operatorul in spatiul abstract: poster,t) = atpost^^y^r), t)) -in general, acest calcul nu poate fi   e costisitor de efectuat precis (in speta operatia de abstractizare a) => variante de abstractie cu predicate, in functie de aproximatia aleasa Verificare formala Curs 8 Marius Minea - fiecare predicat e reprezentat in forma canonica disjunctiva (ca si disjunctie de monoame ф) monom = conjunctie (produs) de predicate pi sau negatia lor - succesorul post^QiKt) pt tranzitia (instructiunea) t e aproximat tot printr-un monom => determinam pentru fiecare predicat daca monomul contine pj sau ^Pi sau nicicare => determinmam pentru fiecare predicat pi daca post^QiKt) implica Pi sau adica, daca ф => wp(p^,t) sau ф => wp(-^,t) Verificare formala Curs 8 Marius Minea - Limitarea la aproximatia succesorilor cu monoame e restrictiva => poate conduce la aproximari grosiere - Pe de alta parte, un calcul mai precis ar putea duce la un numar exponential de apeluri la proceduri de decizie => nefezabil - regiunea ф e despartita recursiv in fragmentele care pot conduce la stari ce satisfac p^, respectiv -ip^ posF^t) = postiunde postk^,t) =рк  ро5Ік+1(ф  ргеГ('у(рк),і),і) '^рк  ро5ік+1(ф  ^ргеГ('у(рк),і), pentru 1 ,t) a adevarat daca ф e realizabil, si fals altfel Verificare formala Curs 8 Marius Minea - Variantele anterioare implica calculul al lui post? pentru orice combinatie de predicate care apare in explorare -in cazul cel mai defavorabil, acest numar este - Solutie: separarea efectelor programului asupra fiecarui predicat => calculeaza o singura data pentru fiecare instructiune care e efectul ei posibil asupra predicatului pi => produce un program boolean abstract in care fiecare instructiune are ca efect atribuirea cu noi valori a fiecarui predicat - adevarat, daca starea dinainte implica wp(7(p^)5t) - fals, daca starea dinainte implica wp(7(-ip^),0 - necunoscut, in caz contrar Verificare formala Curs 8 Marius Minea Exemplu: Proiectul SLAM [Microsoft Research] (Software (Specifications), Languages, Analysis and Model checking) Scopul: verificarea unor proprietati de siguranta (invarianti) concret: un program respecta regulile de utilizare ARi (ex: apelurile la lockO si unlockO alterneaza - concentrat mai ales pe descoperirea erorilor de interfata - utilizat practic pentru device driversin Windows NT XP Caracteristici: - nu necesita anotarea programului de catre utilizator (doar specificarea unor reguli sub forma de automat - monitor) - abstractia e rafinata automat, ghidata de contraexemplele gasite Verificare formala Curs 8 Marius Minea - modelul abstract e graful de flux de control al programului augmentat cu un set ales de predicate boolene peste variabilele de program (la limita, setul initial de predicate poate fi vid) - acest model finit e analizat prin algoritmi de model checking pentru a gasi o eventuala violare a specificatiei - daca modelul e corect, programul e corect (abstractie conservatoare) - daca se gaseste un contraexemplu, acesta e explorat (parcurs) simbolic in programul concret, retinand corelatiile intre variabile - daca contraexemplul e fezabil, s-a gasit o eroare in program - contraexemplul poate fi si nefezabil, daca conjunctia conditiilor necesare pentru a parcurge ramurile alese e nerealizabila (falsa) => contraexemplul e datorat abstractiei prea grosiere -in acest caz, procedura de decizie care a demonstrat nerealizabilitatea sugereaza si ce predicate sunt necesare pentru rafinarea abstractiei - acestea sunt augmentate la modelul anterior si se repeta procedeul Aceste e doar un semialgoritm si succesul terminarea nu e garantata Verificare formala Curs 8 Marius Minea do { request = devExt->WriteListHeadVa; if (request && request->status) { devExt->WriteListHeadVa = request->Next; irp = request->irp; if (request->status > 0) { irp->ioStatus Status = STATUS SUCCESS; irp->ioStatus information = request->Status; } else { irp->ioStatus Status = STATUS UNSUCCESSFUL; irp->ioStatus information = request->Status; } SmartDevFreeBlock(request); loCompleteRequest(irp, i0 N0 iNCREMENT) ; } }  * Fragment de device driver, [Ball & Rajamani ’01] *  Verificare formala Curs 8 Marius Minea state { enum { Unlocked=0, Locked=l } state = Unlocked; } KeAcquireSpinLock return { KeReleaseSpinLock return { if (state == Locked) abort; if (state == Unlocked) abort; else state = Locked; else state = Unlocked; } } Specificarea este tradusa in C si programul original este instrumentat (programul original corect programul instrumentat nu atinge eroare) Verificare formala Curs 8 Marius Minea Porneste de la predicatele din specificatie nondeterminism in control; skip pentru instructiuni irelevante; do { A: skip; if (*) { B: if (*) { skip; } else { skip; } } } Verificare formala Curs 8 Marius Minea Bebop: calculeaza multimea starilor atinse pentru fiecare instructiune dintr-un program boolean, folosind un algoritm de analiza a fluxului de date (dataflow analysis) interprocedural stare = atribuire pentru variabilele din domeniul de vizibilitate multime de stari = functie booleana, reprezentata prin BDD calculul cu multimi de stari: captureaza corelarile intre variabile - nu expandeaza procedurile, exploateaza localitatea variabilelor - foloseste un graf de control explicit - complexitate: liniara in graful de control, exponentiala in nr de variabile vizibile intr-un punct de program Pentru exemplul dat: se semnaleaza eroare, se poate parcurge A: KeAcquireSpinLock() de doua ОГІ succesiv Verificare formala Curs 8 Marius Minea Se foloseste un demonstrator de teoreme si un generator de conditii de verificare pentru a stabili daca contraexemplul in programul abstract reprezinta un contraexemplu in programul concret Evalueaza instructiunile programului folosind constante simbolice, pana cand demonstratorul de teoreme determina fie ca atribuirea la sfarsitul traiectoriei este fezabila, fie gaseste o inconsistenta pe parcurs Daca se gaseste o inconsistenta, se cauta una minimala si se genereaza predicatele corespunzatoare in exemplu: nPacketsOld = nPackets si nPacketsOld != nPackets procedurile de decizie sunt incomplete => poate returna "nu stiu" pt fiecare instructiune, se determina daca poate afecta vreun predicat analiza modulara pt proceduri, analiza de aliasuri pt pointeri, etc Verificare formala Curs 8 Marius Minea do { А:  * b == (nPackets == nPacketsOld) *  if (*) { B: if (*) { skip; } else { skip; }  * choose(pl, p2) == pi ? T : p2 ? F : nondet *  } } Abstractia obtinuta este suficienta pentru a demonstra corectitudinea Verificare formala Curs 8 Marius Minea - in prezent: se pot analiza programe de cca lOkloc si cateva sute de variabile boolene in cateva (zeci de) minute - se estimeaza ca prin optimizari se poate ajunge la cca lOOkloc Verificatoare pentru C, disponibile: BLAST (UC Berkeley), MAGiC (CMU) Optimizare: lazy abstraction [Henzinger, Jhala, Majumdar, Sutre, Berkeley’02] - nu se recreaza abstractia la fiecare iteratie - abstractia curenta este rafinata cu predicatele noi => rafinata doar in fragmentele unde este necesar (on-the-fly) => se pastreaza localitatea (ex abstractii diferite pentru diferitele ramuri de control) Verificare formala Curs 8 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  14 noiembrie 2016 Folosim logica pentru a exprima ( ) rationamente Logica ne permite sa facem din (totdeauna adevarate) si (considerate adevarate in problema data) folosind (de deductie) P p > q q Modus ponens e suficient, dar sunt si alte reguli de deductie valide Logica prepozitionala e : orice formula demonstrata (teorema) e valida : orice formula valida (tautologie) poate fi demonstrata in pentru programe: de exemplu, sortare in conditii ( M filter ( ) pentru datele de prelucrat к v -> к = 5) stud dict cand exprimam proprietati: formalizand teoria multimilor Bempty Vx -contains(empty x) sau structura fisierelor pe disc Vx ((f 7e(x) Ax root) —> contains(parent(x) x)) Un exemplu clasic: (1) Toti oamenii sunt muritori (2) Socrate e om Deci, (3) Socrate e muritor Acesta e un (tipar de regula de inferenta) logica clasica: Aristotel, stoici Seamana cu modus ponens dar premisa din (1) ("toti oamenii") nu e la fel cu (2) (Socrate, un anumit om) Am putea reformula (1): Daca X e om, atunci X e muritor sau mai precis Pentru orice X, daca X e om, atunci X e muritor Logica moderna: (logica de ordinul i) Gottlob Frege, Charles Peirce (sec 19) Vx ((f 7e(x) Лх ф root) —> contains(parent(x) x)) in loc de (a, p, q) avem : file(x), contains(x y) Un = o afirmatie relativ la una sau mai multe variabile, care, dand valori variabilelor, poate lua valoarea adevarat sau fals Apar (orice), (exista) Argumentele predicatelor pot fi x sau contains(parent(x), x) : parent(x) Definim, structural recursiv, notiunile de si v sau c f(tl,       , in) cu f n-ara si ti,       , in (well-formed formulas, formule bine formate): - - ,in) - О! O! —> (3 Vv O! tl = І2 cu P n-ar; ti,       , in unde a este o formula unde a,(3 sunt formule cu v , a formula: cu ti, t2 termeni (in logica de ordinul 1 cu egalitate) in loc de propozitii avem (peste termeni) in logica se pot cuantifica (V, 3) doar variabile in logici de ordin superior, se poate cuantifica si peste predicate Termenii si formulele se pot traduce direct in term = V i F string string * term list predform = Pr string * term list 1 Neg predform i And predform * predform i Or predform * predform i Forall string * predform 0 formula poate contine termeni Termenii nu contin formule! Am ales sa reprezentam constantele ca functii cu zero argumente Atat termenii cat si predicatele au argumente: lista de termeni Exemplu: Vx ->Vy P(x, f(y)) ForallC , Neg(Forall( , Pr( ,[V ; F( , [V ])]))) Notam: Зхір d= -іѴх(-к^) Exista x pentru care ф e adevarata o nu pentru orice x ф e falsa Cei doi cuantificatori sunt Putem scrie si   xip = -іЭх(-к^) Cuantificatorii au decat conectorii Л, —> inseamna: cuantificatorul se aplica la tot restul formulei (pana la sfarsit sau paranteza inchisa) (3x P(x) —> Q(x)) Л  ?(x) inseamna 3x(P(x) —> Q(x)) Л  ?(x) P(x) V Vy Q(y) Л R(x,y) inseamna P(x) V Vy(Q(y) Л  ?(x,y)) in formula  fvip (sau 3v^) variabila v se numeste Variabilele care nu sunt legate se numesc 0 variabila poate fi libera si legata in aceeasi formula Mai sus, x e in 3x P(x) —> Q(x) si e in  ?(x) (ein afara cuantificatorului) intelesul unei formule de variabilele legate intelesul lor e " " de cuantificator ("pentru orice", "exista") pot fi redenumite, fara a schimba intelesul formulei 0 formula are inteles de sine statator, engl Rol similar: parametrii formali la functii in limbaje de programare putem sa ii redenumim fara a schimba efectul functiei x -> x + 3 si у -> у + 3 sunt aceeasi functie interpretarea unei formule de variabilele sale libere (ce valoare primesc; discutam la semantica formulelor) La fel si x -> x + у nu are inteles de sine statator (y se presupune declarat anterior) intelesul efectul depinde de definitia lui у 1 Fiecare investitor a cumparat actiuni sau obligatiuni 2 Daca indicele Dow Jones scade, toate actiunile mai putin aurul scad 3 Daca trezoreria creste dobanda, toate obligatiunile scad 4 Orice investitor care a cumparat ceva care scade nu e bucuros 5 Daca indicele Dow Jones scade si trezoreria creste dobanda, toti investitorii bucurosi au cumparat ceva actiuni de aur Exemplu: http:  www cs utexas edu users novak reso html devin (ca in limbajul natural): cumpara, scade, creste, si (in)directe: predicatului investitor, ceea ce cumpara (actiuni, obligatiuni) (proprietati) sunt despre entitati ( ) bucuros (investitor), de aur (actiune) devin predicate, cu argument obiectul din categorie e actiune, e obligatiune (ce se cumpara) 0 fraza e o (0 argumente) daca verbul apare doar in ea trezoreria creste dobanda ("creste" apare doar aici) 1 Fiecare investitor a cumparat actiuni sau obligatiuni Doua entitati: investitorul, ce cumpara (cu doua categorii) introducem un predicat шѵ(Х) (X e investitor)  nv(X) —> cumpara(X, С) Л (act une(C) V ob  g(C)) Vrem formule (independente de context) X e cuantificat {fiecare investitor) C e cuantificat (investitorul cumpara ) VX  nv(X) —> 3 C cumpara(X, С) Л (act une(C) V oblig(C)) 2 Daca indicele DowJones scade, toate actiunile mai putin aurul scad scade(dj) —> VX act une(X) Л -iaur(X) —> scacfe(X) indicele Dow Jones e o notiune unica folosim o constanta dj Putem folosi si o scadedj (celelalte lucruri care scad sunt actiuni, diferite de indicele general) 3 Daca trezoreria creste dobanda, toate obligatiunile scad crestedob —> VX oblig(X) —> scacfe(X) Dobanda e unicul lucru care creste => predicat fara parametri Alternativ: o constanta dobanda 4 Orice investitor care a cumparat ceva care scade nu e bucuros VX  nv(X) —> (3 C cumpara(X, С) A scade(C)) —> -bucuros(X) —> asociaza la dreapta, p—> r = p—>(q—>r) = p A q —> r, echivalent: ѴХ шѵ(Х) A (3 C cumpara(X, С) A scade(C)) —>  bucuros(X) 5 Daca indicele Dow Jones scade si trezoreria creste dobanda, toti investitorii bucurosi au cumparat ceva actiuni de aur scade(dj) A crestedob —> VX  nv(X) A bucuros(X) —> 3 C cumpara(X, С) A actiune(C) A aur(C) Cuantificatorul ("toti") cuantifica o Toti studentii sunt tineri Studenti C Tineri   x student{x) —> tanar(x) : Л in loc de —>:   x student{x) Л tanar{x) Oricine orice din univers e si student si tanar!!! Cuantificatorul ("unii" Exista premianti studenti Premianti П Studenti 0 "exista") cuantifica o 3x premiant(x) Л student(x) : —> in loc de Л: Bx premiant(x)—> student (x) E adevarata daca exista un ne-premiant! (fals implica orice) Cuantificatorul e distributiv fata de conjunctie’   x(P(x) Л Q(x)) o Vx P(x) A Vx Q(x) dar cuantificatorul NU c distributiv fata de conjunctie: 3x(P(x) A Q(x)) jA (Зх P(x) A 3x Q(x)) avem implicatie —>, dar nu si invers, poate sa nu fie acelasi x i Dual, 3 e distributiv fata de disjunctie: Зх P(x) V 3x Q(x) о Зх Р(х) V Q(x) V nu e distributiv Avem doar: Vx P(x) V Vx Q(x) —> Vx P(x) V Q(x) Ca si in logica prepozitionala: se face pur sintactic determinarea : semantic, considerand (care e universul valorilor, ce inseamna fiecare functie predicat) Dar: avem o infinitate de interpretari nu putem verifica toate => e important sa putem Calculul predicatelor de ordinul intai este si (la fel ca si logica prepozitionala): Orice teorema e valida (adevarata in toate interpretarile atribuirile) Orice formula valida (tautologie) poate fi demonstrata (e teorema) Dar: relatia de implicatie logica e doar daca o formula e o tautologie, ea poate fi demonstrata dar daca nu e valida, incercarea de a o demonstra (sau o refuta) poate sa continue la nesfarsit Putem demonstra o teorema prin aratand ca (nerealizabila) Fie teorema Ai Л Д2 • • • A An —> C adica: ipotezele Ai, A2, An implica impreuna concluzia C Aratam ca ei ->(Ді A A2 A An —> С) e o adica Ai A A2 A An A ->C e contradictie am rescris ->(H —> С) = -i(-i 7 V С) = H A ->C : ipoteze adevarate+concluzia falsa e imposibil Daca o formula e contradictie, putem determina asta prin Rezolutia e o care produce din doua clauze cu (Z si ->L) LvA ^L  B Д V В Clauza obtinuta = celor doua clauze in raport cu L Exemplu: rez ( VqV-ir, V s) = q V -*r V s poate fi privit ca un p V false ->p V q false V q Rezolutia e o regula de inferenta : {p V А,- d) b negat Л (-іа V ->b) b negat Л (-іа V с V ->d) Л (-13 V b V c) b pozitiv Luam o propozitie cu ambele polaritati (b) si construim rezolventii rezb(a V -ib V -id, -iaV b V с) = з V -id V -,aV с = T rez >(-i3 V ->b, -13 V b V c) = -13 V ->a V с = ->a V c Adaugam noii rezolventi (ignoram T); eliminam vechile clauze cu b (- а V с V -id) A (-іа V c) Nu mai putem crea rezolventi Nu avem clauza vida formula e realizabila, de exemplu cu a = F Sau cu с = T Pentru o atribuire suficienta ca sa faca formula realizabila, revenim la formula initiala, si dam valori si lui b si sau d а Л (-іа V b) Л(-іЬѴс) с pozitiv Л (-іа V-ib V-ic) с negat Aplicam rezolutia dupa c, avem o singura pereche de clauze: rezc(-ib V c, -13 V -ib V -ic) = -ib V -13 V -ib = -13 V -ib Eliminam cele doua clauze cu c si adaugam clauza noua: 3 A (-13 V b) A (-13 V ->b) Aplicam rezolutia dupa b: rez >(-i3 V b, -13 V ->b) = -13 V -13 = -13 Eliminam cele doua clauze cu b, adaugam clauza noua: 3 ь A -13 Aplicam rezolutia dupa a: reza(a  a) = F (clauza vida) Deci formula initiala e o contradictie (e nerealizabila) Pornind de la o formula in forma normala conjunctiva (CNF), , incercand sa Alegem o propozitie p si adaugam toti rezolventii in raport cu p: din m clauze cu p si n clauze cu —*p, cream m   n rezolventi am eliminat p => stergem cele m+n clauze initiale Daca vreun rezolvent e , formula e Daca nu mai putem crea rezolventi (literalii au polaritate unica), formula e (facem T toti literalii ramasi) Numarul de clauze poate creste exponential (problematic!) Algoritmul DPLL aplica rezolutia doar la clauze cu un literal formula nu creste, dar poate incerca nr exponential de cazuri in logica predicatelor, un nu e o propozitie, ci un nu doar p si —>p, ci P( ) si ->P( ) => trebuie sa tinem cont de argumentele predicatului Fie doua formule in care un predicat apare pozitiv si negativ: Vx Vy P(x, g(y)) si Vz ->P(z, a) sau Vx Vy P(x, g(y)) si   z ^P(a,z) Se contrazic ? Cuantificarea universala inseana ca variabila poate lua valoare => o putem cu un in exemplul 2, substituind x a, z g(y) obtinem P(a,g(y)) si ^P(a,g(y)), in ex 1 nu putem substitui a cu g(y) (a nu e variabila) g e functie arbitrara, nu stim ca exista un у cu g(y) = a О е о care asociaza unor niste {хі ь-> ti, ,хп in} Doi termeni se pot daca exista o substitutie care ii face egali f(x, g(y, z), t){x h(z), у h(b), u} = g(h(b), z), u) O x poate fi unificata cu orice t (substitutie) daca x in t deci nu: x cu g(x, z)) pentru ca altfel, substitutia ar duce la un termen infinit (Dar: putem unifica in cazul trivial, x cu x) Doi f( ) Pot fi unificati doar daca au functii identice, si (termeni) pot fi unificate unul cate unul Doua pot fi unificate doar daca sunt (caz particular, o constanta e o functie cu zero argumente) Vom discuta ulterior detalii si un algoritm de unificare Fie doua clauze A si B, si un predicat P (apare pozitiv si negat) Redenumim variabilele comune (pot insemna altceva in A si in B) Alegem literali Pi,Pj G A si -iPj+i, ->Pj+k G В cu pred P Unificam termenii {Pi, , Pj, Pj+i, Pj+k} La clauza A U В   {Pi, Pk, Pk+i,       Pk+i} aplicam substitutia rezultata din unificare Adaugam noua clauza la lista clauzelor Daca repetand obtinem clauza vida, formula initiala nu e realizabila Daca nu mai putem crea rezolventi noi, formula initiala e realizabila Metoda rezolutiei e relativ la refutatie pentru orice formula nerealizabila, va ajunge la clauza vida dar nu poate realizabilitatea (exista formule pentru care ruleaza la infinit) Reluam exercitiul formalizat anterior Folosim () si nu pentru a nu gresi la ce se aplica cuantificatorii Ді: VX( m (X) —> 3 C(cump(X, С) Л (act(C) V od  g(C)))) Д2: scadedj —> VX(act(X) A -aur(X) —> scade(X)) Д3: crestedob —> VX(oblig(X) —> scade(X)) Д4: VX( m (X) —> (3 C(cump(X, С) A scade(C)) —> -ibucur(X))) C: scadedj A crestedob —> VX(jnv(X) A bucur(X) —> 3 C(cump(X, С) A act(C) A aur(C))) Pentru a demonstra Ді A Д2 A Д3 A Д4 —> C prin , aratam ca Ді A Д2 A Д3 A Д4 A ->C e -iC : scadedj A crestedob A -iVX(jnv(X) A bucur^X) —> 3 C(cump(X, С) A act(C) A aur(C))) Negam concluzia , inainte de a transforma cuantificatorii! 1 2 Ducem : А В =  А V В, ^(Д В) = А Л : ^ѴхР(х) = Зх^Р(х) ^ЗхР(х) = Ѵх^Р(х) Ді: VX( nv(X) —> 3 C(cump(X, C) A (act(C) V ob  g(C)))) VX(-i m (X) V 3 C(cump(X, С) A (act(C) V ob  g(C)))) Аг: scadedj —> VX(act(X) A -iaur(X) —> scade(X)) -^scadedj V V X( act(X) V aur(X) V scacfe(X)) Д3: crestedob —> VX(oblig(X) —> scade(X)) -^crestedob V V X( oblig(X) V scacfe(X)) Д4: VX( m (X) —> (3 C(cump(X, С) A scac e(C)) —> -ibucur(X))) VX(-i m (X) V -13 C(cump(X, С) A scac e(C)) V -ibucur(X)) VX(-i m (X) V V C(-icump(X, С) V -iscacfe(C)) V -ibucur(X)) ATENtiE! in  fx(formula), cand transformam formula (—>, -1, ) NU se schimba cuantificatorul care e ei (nici la 3x) —>C : scadedj Л crestedob Л -iVX(jnv(X) A bucur(X) —> 3 C(cump(X, С) Л act(C) Л aur(C))) scadedj Л crestedob Л 3X(inv(X) Л bucur(X) A -13 C(cump(X, С) Л act(C) Л aur(C))) scadedj A crestedob A 3X( w(X) Л bucur(X) А V C(-icump(X, С) V -iact(C) V -iaur(C))) 3 variabilele cuantificate: in fiecare clauza, pentru a putea elimina ulterior cuantificatorii De exemplu: Vx P(x) V 3xVy Q(x,y) devine Vx P(x) V 3zVy Q(z,y) Nu e nevoie in exemplul nostru: Ді: VX(-Vnv(X) V 3 C(cump(X, С) A (act(C) V ob  g(C)))) Д2: -scadedj V VX( act(X) V aur(X) V scade(X)) Д3: -crestedob V VX(-iob  g(X) V scade(X)) Д4: VX(-i nv(X) V V C(-icump(X, С) V -iscade(C)) V -ibucur(X)) - С: scadedj A crestedob A 3X( nv(X) A bucur(X) Л V C(-icump(X, С) V -iact(C) V -iaur(C))) 4 Pentru 3yin interiorul lui Vxi Vxn, introducem o у = g(xi, ,xn): valoarea lui у depinde de xi, xn Ді: VX(-> nv(X) V 3 C(cump(X, С) A (act(C) V ob  g(C)))) devine VX(-i nv(X) V (cump(X, f(X)) A (act(f(X)) V od  g(f(X))))) acel C care exista depinde de X => alegem o noua functie f(X) Atentie! fiecare cuantificator primeste o Skolem! Pentru 3y in , se alege o noua -iC: scadedj A crestedob A 3X( nv(X) A bucur(X) ЛѴ C(-icump(X, С) V -iact(C) V -iaur(C))) in loc de 3X alegem pentru X o noua constanta b: scadedj A crestedob A inv(b) A bucur(b) MC(-cump(b С) V -iact(C) V -iaur(C)) 5 Ducem cuantificatorii universali in fata: Д4: VX(-> nv(X) V V C(-icump(X, С) V -scade(C)) V -ibucur(X)) VXVC(-i nv(X) V -icump(X, С) V -scade(C) V -ibucur(X)) 6 Eliminam cuantificatorii universali (devin impliciti, o variabila poate fi inlocuita cu orice termen) Ді: -i nv(X) V (cump(X, f(X)) Л (act(f(X)) V ob  g(f(X)))) Д2: -scadedj V -iact(X) V aur(X) V scade(X) Д3: -crestedob    -oblig(X)    scade(X) Д4: -i nv(X) V -icump(X, С) V -iscacfe(C) V -ibucur(X) -iC: scadedj A crestedob A inv(b) A bucur(b)   (-cump(b С) V -iact(C) V -iaur(C)) 7 Ducem conjunctia in exterior (prin distributivitate) si scriem fiecare clauza separat ( ) (1) V cump(X, f(X)) (2) V act(f(X)) V ob  g(f(X))) (3) -scadedj V -iact(X) V aur(X) V scade(X) (4) -crestedob V -oblig(X) V scade(X) (5) V -icump(X, С) V -scade(C) V -bucur(X) (6) scadedj (7) crestedob (8) inv(b) (9) bucur(b) (10) -cump(b С) V -iact(C) V -iaur(C) Cautam predicate P( ) si si unificam, obtinand rezolventii: (11) -iact(X) V aur(X) V scacfe(X) (3, 6) (12) -cump(b С) V -iact(C) V scacfe(C) (10, 11, X= C) (13) -oblig(X) V scacfe(X) (4, 7) Cand unificam, redenumim clauzele sa nu aibe variabile comune: (13) - ) (20) 0 (contradictie = succes in reducerea la absurd) (8, 19) Putem traduce ( predicatelor ) afirmatii din limbaj natural in logica Putem prin reducere la absurd: negam concluzia transformam in prin metoda (conjunctie Л de disjunctii V) gasim o (clauza vida) 21 noiembrie 2011 O variabila х de tipul tip are o &x de tipul Adresele sunt nenule Valoarea (0) indica o adresa invalida Variabila x ocupa sizeof (x) octeti pornind de la &x Numele t al tabloului tip t ; e tabloului (a primului element, &t ) Adresa t are tipul Functiile au ca parametri tabloului, NU continutul sau void f (tip t ) ; e ca void f (tip t []) ; si ca void Primind adresa unei variabile, functia o poate citi si Ex: scanf (atribuie valori citite de la intrare), functii cu tablouri (pot modifica , dar nu , transmisa prin i) O "sir" are tipul Valoarea constantei "sir" este unde se afla sirul un char (’a’) e diferit de un sir (adresa) "a" Comparam siruri cu strcmp, strncmp, NU cu == Operatorul == compara adrese (UNDE se afla sirul), dar putem avea siruri egale chiar daca sunt la adrese diferite! au tip, valoare, loc in memorie, adresa pot fi declarati, atribuiti, tipariti, dati parametri au operatii specifice (dereferentiere *, aritmetica + - ++ Pointer = o variabila care contine adresa altei variabile tip *nume-var; nume-vare pointer la o valoare de tip operator prefix operand: o variabila (ex x); rezultat: variabilei &x au adrese doar variabile (si elem tablou), NU constante, expresii adresa unei variabile se poate atribui unui pointer la acel tip: int x; int *p; p = &x; operator prefix operand: pointer; rezultat: (variabila) indicat de pointer *p poate fi folosit la stanga unei atribuiri (engl ), ca si variabilele sau elementele de tablou; daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, y, *p; p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) &*p e p (daca p e pointer valid): adresa obiectului de la adresa p Putem citi tip * p; Variabila Valoare Adresa tip * p; p are tipul tip * int x = 5; 5 0x408 tip *p; *p e un caracter int *p=&x; 0x408 0x51C char adresa de adr de char char *t ; tab de 8 adr de char int **pp=&p; 0x5 iC 0x9D0 0 cu NU este o i int t = { 3, 5 }; initializeaza t incorect: t - { 3, Б }; int x, *p = &x; e la fel ca int x; int *p; p = &x; (e initializat atribuit p, NU *p) *p - &x e incorect ca tip! char *p = "sir"; e char *p; p = "sir"; Gresit: *p   "sir;" Е о sa folosim о { int sum; for (i=0; i++ programul incepe calculul cu o valoare cu unei variabile (sau cu alt pointer initializat deja) cu o adresa de memorie (vom discuta ulterior) 1Т 1Т : int *p; *p = 0; : char *p; scanf ("70s", p); p este (eventual nul, daca e variabila globala) valoarea e scrisa la o memorie corupta, vulnerabilitati de securitate, terminare fortata ATENtiE: un pointer nu este un intreg Gresit: int *p   640; i NU putem alege adresa unei variabile (unde sa e pusa in memorie) se determina la incarcarea programului   cand se aloca memoria Avand adresa unei variabile ii putem : *p = primind adresa unei variabile, o functie poate modifica valoarea ei scanf primeste , completeaza cu valori citite parametrii sunt transmisi : adresa nu se modifica void swap (int *pa, int *pb) {    schimba valori de la 2 adrese int tmp;    var temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim adrese ca parametri de functii: ca sa transmitem tablouri (altfel nu se poate) pentru a intoarce mai multe rezultate (functia permite doar unul) ex minimul maximul unui tablou; rezultat cod de eroare in C notiunile de si sunt declararea unui tablou aloca un bloc de memorie pt elemente tabloului e blocului de mem (a primului element) Daca declaram tip a[LEN] , *pa; putem atribui pa = a; &a e echivalent cu a iar a e echivalent cu *a Diferenta: adresa a e o (tabloul e alocat la o adresa fixa) a = adresa, dar putem atribui pa = adresa Ca parametri la functii, cele doua scrieri inseamna size t strlen(char s []); sau size t strlen(char *s) ; Ca declaratii, de tablou   pointer, : char s [] = "test"; s e ’t’, s e ’ 0’ etc s e (tip char *), nu variabila cu loc in memorie NU se poate atribui s = , se poate atribui s = ’f ’ sizeof (s) e5 * sizeof (char) &s e chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) : char *p = "test"; p e ’t’, p e ’ 0’ (la fel) p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f ’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; si apoi p = ’f ’ sizeof (p) e sizeof (char *) &p NU ep GREsiT: scanf ("704s" , &p); CORECT: scanf ("704s" , p); O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar gasi urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou char *endptr(char *s) {    ret pointer la sfarsitul lui s char *p = s;    sau: char *p; p = s; while (*p) p++;    adica la pozitia marcata cu ’ 0’ return p; 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul intreg de obiecte de tip care incap intre cele 2 adrese Diferenta numerica in octeti: se convertesc pointerii la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite alte operatii aritmetice pentru pointeri i Se pot efectua operatii logice de comparatie (==, ! = , o functie cu tablou are nevoie de toate dimensiunile in afara de prima => trebuie declarata tip-fi Ctip-t t [] [DiM2]); char t ={"ian", ,"dec"}; char *p ={"ian", ,"dec" p e un tablou de pointeri 0x460 > i a n  0 0x5C4 f e b  0 0x9FC d e c  0 p ocupa 12*sizeof(char *) octeti t = e GREsiT (t e adresa constanta a liniei 7) (+ 12*4 octeti pt constantele sir) p = "iulie" modifica o adresa (elementul 7 din tabloul de adrese p) Linia de comanda contine urmat de eventuale (parametri): optiuni, nume de fisiere Exemple: gcc -Wall -o prog prog c is director cp fisierl fisier2 in C, accesam linia de comanda declarand main cu 2 parametri: int argc nr cuvinte din linia de comanda (nr argumente + 1) char *argv[] tablou, adresele argumentelor (siruri de caractere) #include int main(int argc, char *argv[]) { printf("Numele programului: 70s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element NULL (argv[argcj) Variante de printf scanf cu sursa destinatie si siruri de char int sprintf(char *s, const char *format, int sscanf(const char *s, const char *format, sprintf nu are limitare poate depasi marimea tabloului Folositi int snprintf(char *str, size t size, const char *format, in care scrierea e limitata la size caractere varianta sigura int n; char *s, *end; if (sscanf (s, "70d", &n) == 1) (citire corecta) (folosim cand nu trebuie prelucrat restul sirului dupa numar) strtol: atribuie adresa primului caracter ramas, putem prelucra restul n = strtol(s, &end, 10); (in baza 10, sau in alta baza) n = atoi(s); (returneaza 0 la eroare, dar si la sirul "0") Pana acum am indicat prin pointeri doar variabile deja declarate: int x; int *p; p = &x; char a ; char *s; s = a+5; Am declarat static doar tablouri de dimensiuni cunoscute si fixe (in C99 se permit dimensiuni variabile, evaluate la rulare) Nu putem returna un tablou declarat intr-o functie L-am declarat in afara functiei, am transmis adresa la functia care-l completeaza, (scanf, strcpy, strcat, exemplele de lucru cu vectori matrici) Functiile de (stdlib h) permit sa creem variabile noi de dimensiuni necesare aparute la rularea programului tip *p declara doar o variabila NU si loc pentru un (variabila) de acel tip Declaratia char *s; NU aloca memorie pentru continutul sirului! void *malloc(size t size); aloca size octeti void *calloc(size t n, size t size); n*size octeti init cu 0 Returneaza adresa blocului de memorie alocata sau NULL la eroare (mem insuficienta) unei zone alocate cu malloc calloc: void *realloc(void *ptr, size t size); modifica marimea la size Poate muta continutul existent si returna alta adresa decat ptr if (pl = realloc(p, size)) { p = pl;  * apoi folosim p *  } Memoria alocata dinamic cand nu mai e necesara void free(void *ptr); elibereaza memoria alocata cu c malloc int *t; unsigned i, n; printf("Nr de elemente ?"); if (scanf ("’ ou", &n) == 1) if ((t = malloc(n * sizeof(int))) != NULL) for (i = 0; i #include #define BLOCK 16 char *getline(void) { char *p, *s = NULL;    s initializat pentru realloc int c, lim = -1, size =0;    pastram un loc pentru  0 while ((c = getcharO) != EOF) { if (size >= lim)    s-a umplut zona alocata if (!(p = realloc(s, (lim+=BLOCK)+l))) {    mai aloca 16 ungetc(c, stdin); break;    termina daca nu mai e loc } else s = p;    tine minte noua adresa alocata s[size++] = c;    adauga ultimul caracter if (c == ’ n’) break;    iese la linie noua }    termina cu  0, realoca doar cat e nevoie if (s) { s[size++] = ’ 0’; s = realloc(s, size); } return s; e necesara cand stim dinainte de cata memorie e nevoie NU: int *px; px = malloc(sizeof(int)); scanf ("70d", px) ; Mai simplu: int x; scanf ("° "d", &x); , cand nu stim de la compilare cata memorie e necesara (tablouri cu dimensiuni aflate la rulare, liste, arbori, etc ) , cand trebuie sa returnam un obiect nou creat dintr-o functie (NU putem returna adresa var locale, memoria dispare la revenire!) char *strdup(const char *s) {    creeaza copie a lui s char *d = malloc(strlen(s) +1);    loc pentru sir si ’ 0’ return d ? strcpy(d, s) : NULL;    fa copia, returneaza d , cand trebuie pastrat un obiect citit intr-un loc temporar char *tab , buf ; while (i 0) are argumente void *, compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *);   tip ptr fct int intcmpdnt *pl, int *p2) { return *pl - *p2; } int tab = { -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sort crescator Marius Minea 15 aprilie 2008 Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 2 char *fgets(char *s, int size, FiLE *stream);   deci, in stdio h Citeste pana la (si inclusiv) linie noua  n, dar max size-1 caractere pune linia in tabloul s, adauga ’ 0’ la sfarsit Exemplu: char tab ; fgets(tab, 80, stdin); Parametrul al treilea: un fisier (discutam ulterior); pentru a citi de la intrarea standard, folosim identificatorul stdin (din stdio h) fgets returneaza null daca n-a citit nimic (sfarsit de fisier) la succes: returneaza chiar adresa primita parametru (deci nenula) => Testam de rezultat nenul pentru a sti daca s-a citit cu succes: Exemplu: citire + afisare linie cu linie pana la sfarsitul intrarii char s ; while (fgets(s, 81, stdin)) printf ("° os", s) ; liniile mai lungi de 80 de caractere se citesc afiseaza pe bucati NU folositi functia gets ! Nu se poate specifica lungimea maxim disponibila => se poate depasi zona de memorie alocata! => program abandonat, corupere de memorie, vulnerabilitati de securitate Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 3 int printf(const char* format,    tiparire formatata restul parametrilor: de tiparit (orice ) returneaza: nr de caractere tiparite; specificatori de format: 7oC char, ° od decimal, ° of float, ° op pointer, ° os sir, ° ou unsigned, ° ox heXa int scanf(const char* format,    citire formatata restul parametrilor: variabilelor de citit Exemple: int n; scanf ("° od", &n); float a ; scanf ("° of", &a ); Format: ca printf, cu unele diferente Ex ° of float, ° olf double returneaza: variabilelor citite (atribuite) (NU valoarea!), sau EOF daca apare o eroare de intrare inainte de citirea primei variabile => folosim rezultatul pentru a testa daca s-au citit cele dorite: int n; if (scanf ("° od", &n)==l) { * s-a citit* } else { * eroare * } Utilizatorul poate introduce orice si oricat => la orice citire (fgets, getchar, scanf etc ) ! Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 4 Pe langa specificatori, sirul de format poate avea la printf: se tiparesc; la scanf: unsigned z, 1, a; scanf ("° ou ° ou ° ou", &z, &1, &a) ;    15 4 2008 cu scanf citeste pana cand intrarea formatului, apoi revine Restul variabilelor nu se atribuie; caracterele necitite raman in intrare Exemplu: int x, y; intrare: 123A scanf ("7odo od", &x, &y); returneaza 1; x = 123, y: necitit; ramas: A scanf ("7odo ox", &x, &y); returneaza 2; x = 123, y: OxA (10) => trebuie inainte de a solicita din nou date int m, n; printf("introduceti doua numere: while (scanf ("7od7od", &m, &n) != 2) {    cat timp nu e corect while (getcharO != ’ n’);    consuma restul liniei printf("mai incercati o data: "); }    acum putem folosi m si n Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 5 Citirea unui caracter: char c; scanf ("° oc", &c); testati rezultatul (1?) Mai simplu: int c = getchar; if (c != EOF)    are valoare de char Citirea mai multor caractere: intr-un tablou (sir), in limitele acestuia: - un : char s ; scanf ("° 080c" , s) ; orice caractere, inclusiv spatii albe; NU adauga ’ 0’ la sfarsit - un (orice pana la spatiu alb) char s ; scanf ("° 079s", s); consuma si ignora spatii albe initiale; adauga ’ 0’ la sfarsit - sir dintr-o % E ] char a ; scanf ("° 032 [A-Za-z ] " , a); max 32 litere sau - sir % Г ] char t ; scanf ("° o8O [ , 0-9]", t); max 80, pana la cifra , sau Numele de tablou , nu mai trebuie pus & E intre % si s [] [ ] (-1 fata de tablou, pt ’ 0’) lipsa e o => corupere de memorie, atacuri de securitate Formatul citeste cuvant (pana spatii), nu linie! Formatul NU e Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 6 - formatele si consuma (sar peste) spatii albe initiale "7odo od" doi intregi separati si eventual precedati de spatii albe - formatele c [ ] ] nu sar peste spatii albe; ele nu au rol special - un spatiu alb in sirul de format consuma oricate spatii albe din intrare scanf (" "); consuma toate spatiile albe pana la primul alt caracter "7oC 7oc" citeste caracter arbitrar, consuma spatii, citeste alt caracter "° od ° of" acelasi efect ca "70d° 0f" (spatiile sunt permise oricum) Atentie! "7od " : dupa numar consuma spatii pana la altceva! - un numar intre 7o si caracterul de format limiteaza caracterele citite 7o4d intreg din cel mult 4 caractere (spatiile initiale nu conteaza) scanf ("7od7od" , &m, &n) ; scanf ("7o2d7o2d" , &m, &n) ; scanf ("7od 70d" , &m, &n) ; scanf ("7of", &x) ; scanf ("7od7oX" , &m, &n) ; 12 34 m=12 n=34 12345 m=12 n=34 rest: 5 12 34 m=12 n=34 12 34 x=12 34 123a m=123 n=0xA Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 7 ° od: intreg zecimal cu semn 7oi: intreg zecimal, octal (0) sau hexazecimal (Ox, ox) ° oo: intreg in octal, precedat sau nu de 0 ° ou: intreg zecimal fara semn ° oX, ° oX: intreg hexazecimal, precedat sau nu de Ox, ox ° oc: orice caracter; nu sare peste spatii (doar " ° oc") ° os: sir de caractere, pana la primul spatiu alb Se adauga ’ 0’ ° oa, ХА, ° oe, ХЕ, ° of, ° 0F, ° og, ° 0G: real (posibil cu exponent) ° op: pointer, in formatul tiparit de printf ° on: scrie in argument (int *) nr de caractere citite pana in prezent; nu citeste nimic; nu incrementeaza nr de campuri convertite atribuite %[•••]: sir de caractere din multimea indicata intre paranteze • •]: sir de caractere exceptand multimea indicata intre paranteze ’ o’Z: caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 8 7"d, 70i: intreg zecimal cu semn 7"o: intreg in octal, fara 0 la inceput 7ou: intreg zecimal fara semn 7 x, 7 x: intreg hexazecimal, fara 0x 0X; cu a-f pt 7 x, A-F pt 7 x 7"c: caracter 7"s: sir de caractere, pana la ’ 0’ sau nr de caractere dat ca precizie 7"f, 7"F: real fara exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7"e, 7"E: real, cu exp ; precizie implicita 6 poz ; la precizie 0: fara punct 7"g, 7 G: real, ca 7"e, 7 E daca exp precizia; altfel ca 7"f Nu tipareste zerouri sau punct zecimal in mod inutil 7"a, 7 A: real hexazecimal cu exponent zecimal de 2: Ox i hhhhp±d 70p: pointer, in format dependent de implementare (tipic: hexazecimal) 7oii: scrie in argument (int *) nr de caractere scrise pana in prezent; 7 7 : caracterul procent Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 9 Directivele de formatare pot avea optional si alte componente: % fanion dimensiune precizie modificator tip : *: campul este citit, dar nu e atribuit (e ignorat) aliniaza valoarea la stanga, la dimensiunea data +: pune + inainte de numar pozitiv de tip cu semn spatiu', pune spatiu inainte de numar pozitiv de tip cu semn 0: completeaza cu 0 la stanga pana la dimensiunea data (scanf) (printf) (printf) (printf) (printf) hh: argumentul este char (pt diouxXn) char c; scanf ("° ohhd", &c) ;    intrare: 123, c = 123 pe 1 octet dar: char c; scanf ("° oc", &c) ;    intrare: 123, c = ’ 1’ (49 ASCii) h: argumentul este short (pt diouxXn), ex 7ohd 1: arg este long (pt diouxXn), ex long n; scanf ("° old", &n) ; sau double (pt aAeEfFgG), ex double x; scanf ("° olf" , &x) ; 11: argumentul este long long (pt diouxXn) L: argumentul este long double (pt aAeEfFgG) Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 10 : un numar intreg scanf: numarul maxim de caractere citit pentru argumentul respectiv printf: numarul minim de caractere pe care se scrie argumentul (aliniat la dreapta si completat cu spatii, sau conform modificatorilor) : doar in printf; punct urmat de un numar intreg optional (daca apare doar punctul, precizia se considera 0) numarul minim de cifre pentru diouxX (completate cu 0) numarul de cifre zecimale pentru Eef   cifre semnificative pentru Gg printf (" |° 07 2f i", 15 234); i 15 23І 2 zecimale, 7 caract total numarul maxim de caractere de tiparit dintr-un sir (pentru s) char m ="ian"; printf ("° 0 3s", m) ; (util pt sir neterminat in ’ 0’) in printf, in locul dimensiunii si sau preciziei poate apare * Atunci dimensiunea se obtine din argumentul urmator: printf ("° 0 *s", max, s); scrie cel mult max caractere din sir Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 11 Scriere de numere reale in diverse formate: 1 0 1100); 1 0 1100); 1 0 11000); 1 0); printf ("° 0 2f n" , 1 009);    0 000909 : 6 pozitii zecimale    0 000909091 : 6 poz semnificative    9 09091e-05 : 6 poz semnificative    1 000000e+00 : 6 cifre zecimale    1 000000 : 6 cifre zecimale 1 : fara punct zecimal, zerouri inutile    1 01: 2 cifre zecimale printf ("° 0 2g n" , 1 009);    1: 2 cifre semnificative Scriere de numere intregi in forma de tabel: printf (" | ° o6d | " , -12); printf (" | ° o"6d | " , -12); printf (" | ° o+6d | " , 12); i -12| 1-12 | i +12| printf (" Г o d| ", 12) ; printf (" | ° oO6d | " , -12); i 12| i-00012| Scriere pe total 20 de pozitii (printf returneaza nr de caractere scrise) int m, n, len = printf ("° od" , m) ; printf ("° 0*d" , 20-len, n) ; Programarea calculatoarelor Curs 8 Marius Minea Programarea calculatoarelor Functii de intrare iesire 12 - doua caractere separate de un singur spatiu (citit si ignorat cu ° 0*l [ ]) char cl, c2; if (scanf ("70c70*l [ ]7oC", &cl, &c2) == 2) { * etc * } - citirea unui intreg cu exact 4 cifre: unsigned nl, n2, x; if (scanf (" 7оп7о4и7оп", &nl, &x, &n2) == 1 && n2 - nl == 4)  * etc *  (7on numara caracterele citite; stocam contor in nl, n2, apoi scadem) - citeste verifica un cuvant care trebuie sa apara in intrare int nr=0; scanf ("http:  7оП", &nr); if (nr == 7) {  *apare, s-a citit tot*  } else {  *nu ajunge la formatul 70n, nr ramane cu val dinainte 0*  } - ignora pana la (exclusiv) caracter anume (ex  n): scanf ("7o*[  n]"); Testati dupa numarul dorit de variabile citite, nu doar numar nenul! if (scanf ("7od" , &n) == 1) si nu doar if (scanf ("7od" , &n)) scanf poate returna si EOF care e diferit de zero ! Pentru numere intregi, testati si depasirea, folosind extern int errno; #include    declara errno + constante pt clase de erori if (scanf ("7od", &x) == 1))    testam si resetam errno pt depasire if (errno == ERANGE) { printf("numar prea mare"); errno = 0; } Programarea calculatoarelor Curs 8 Marius Minea 4 decembrie 2003 Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 2 Un tip defineste o multime de valori si operatiile posibile cu acestea Adeseori e nevoie de alte tipuri (mai complexe) decat cele de baza, in C se pot defini tipuri enumerare, structura si uniune cu sintaxa: cuvant cheie opt nume tip specificatie tip optdista declaratori ; unde cuvant cheie ::= enum | struct | union opinumetip' pt referire ulterioara (prefixat cu enum, struct, union) optJista declaratori: pot fi declarate obiecte de tipul respectiv - opt nume tip e intr-un spatiu de nume diferit de cel comun pentru variabile, tipuri si functii E mai clar sa folosim totusi nume diferite Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 3 Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: enum opinumetip { lista constante } opt lista declaratori ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - acelasi nume de constanta nu poate fi folosit in doua enumerari diferite - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante int ore lucru ; enum zile sapt {D, L, Ma, Mc, J, V, S} zi; for (zi = L; zi e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si () si □ Atentie la ordinea de evaluare ! p->x++ inseamna (p->x)++ ++p->x inseamna ++(p->x) *p->x inseamna *(p->x) *p->s++ inseamna *((p->s)++) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 8 in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie", char zile luna = { 31, 28, 31, 30,  * e preferabila varianta urmatoare *  typedef struct { char *nume; int zile; } tip luna; tip luna luni = { {"ianuarie", 31}, , "decembrie" }; ,30, 31 }; , {"decembrie", 31} }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 9 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {  * o lista de cuvinte *  char *word; struct wl *next;  * informatia propriu-zisa *   * pointer la acelasi tip de structura *  Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  * declaratie incompleta *  struct t { int val; tree *left, *right;  * foloseste numele din typedef *  Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 10 Se pot declara campuri intregi cu un numar specificat de biti => Testarea setarea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : intconst ; | : intconst ; struct packet { int : 2;  * primii doi biti nu intereseaza *  int error: 1;  * un bit, semnalizeaza eroare *  int status: 3;  * un camp pe 3 biti *  int : 0;  * forteaza alinierea la octetul urmator *  int seq no: 4;  * numar de secventa pe 4 biti *  } pkt; if (pkt error) { } else if (pkt status == 5) { } else pkt seq no++; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 11 Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { lista campuri } opt lista declaratori ; Lista de campuri este insa o lista de variante: - o variabila structura contine toate campurile declarate - o variabila uniune contine exact una din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune nu contine informatii despre varianta reprezentata - acest lucru trebuie memorat explicit in program (in alta variabila) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 12 Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) - date suplimentare pentru identificatori (nume) si constante (valoare) enum tok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , СОММА, typedef union { char *id;  * int ival;  * float fval;  * } lexvalue; sir de caractere pentru identificator *  valoare pentru constanta intreaga *  valoare pentru constanta reala *  enum tok token; lexvalue iv; switch (token) { case iDENT: printf ("° os", iv id); break; case iNUM: printf ("° od", iv ival); break; case FNUM: printf ("° of", iv fval); break; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  20 noiembrie 2017 Un algoritm de unificare Programare logica specificam vrem sa obtinem cauta automat (decide bazata pe rezolutie Ce e o "demonstratie" si "totdeauna adevarat" si limitele a ce putem demonstra in logica predicatelor, rezolutia un literal cu negatul lui: A V Ptt-L, t2,in) si 6 V- P(tp t^) daca putem unifica ("potrivi") argumentele lui P si - unificate daca sunt identice => cu aceste reguli, putem gasi (orice alt unificator se poate obtine din el printr-o alta substitutie) Daca unificam pe x cu у si apoi pe у cu f(z, a), atunci si x e unificat cu f(z, a) => Trebuie sa retinem ce variabile sunt structura de date+algoritm pentru lucru cu clase de echivalenta Operatii: (element): gaseste reprezentantul clasei de echivalenta (eleml, elem2): declara elementele ca fiind echivalente (raman echivalente mai departe) O implementare: padure de cu legaturi de la fiu la parinte : returneaza radacina (chiar nodul, daca e singur) : leaga radacina unuia de radacina celuilalt g(Z) Y X find(X) = find(Y) = g(Z) union(Y, S) leaga find(Y) si find(S) = de la variabile (string) la termeni union(D, Ti, T2) produce care unifica Ti cu T2 pornind de la o substitutia   dictionarul D existent construim substitutia pas cu pas, unificand succesiv termeni find(D,X) cauta recursiv reprezentantul lui X ("ceinseamna") adica aplica lui X substitutiile din D Exemplu: unificam f(x, g(x, s(z)), t) cu g(h(b), u), z) x cu h(z) => {x h(z)} g(h(x),z) cu g( ?(b), u) => x cu  7(6) => h(z) cu Л(Ь) =>{x h(z),z b} s(z) cu и => {x h(z), z b и s(z)} t CU Z X- t cu b =- [x H f(z), Z H b,u H s(z), t b} Substituind pana la capat: {x f(b),z b, U s(b), t b} Programatorul specifica interpretorul ce se stie despre problema, cautand demonstratii fiu(ion, petre) fiu(george, ion), fiu(radu, ion) fiu(petre, vasile) desc(X, Y) fiu(X, Y) desc(X, Z) fiu(X, Y), desc(Y, Z) (predicate adevarate) fiu(ion, petre) e implicatie acc i h :: t -> rev2 (h::acc) t rev3(nil, R, R) rev3(c(H, T) , Ac, R) rev3(T, c(H, Ac), R) rev(L, R) rev3(L, nil, R) Cu intrebarea rev(c(l, c(2, c(3, nil)))), X) obtinem derivarea: rev(c(l, c(2, c(3, nil))), X) rev3(c( , ), nil, X) rev3(c( , ), c( ,nil),X) rev3(c( , ), c( , c(l, nil)), X) rev3(nil c( , c(2, c(l, nil))), X) Ll=c(l,c(2,c(3,nil))), R1=X Hl= , Tl= , Acl=nil H2= , T2= , Ac2=c(l,nil) H3= , T3= , Ac3=c(2,c(l,nil)) X=c(3,c(2,c(l,nil))) Prolog foloseste un caz particular de rezolutie: = clauze cu (reguli): pi gi V V -*gm Pentru clauze Horn, rezolutia se aplica mai simplu: se porneste de la tinta se cauta pe rand fiecare scop partial gj in concluziile regulilor si se inlocuieste cu conjunctia premiselor din regula (clauza) pana cand in toate cazurile se ajunge la fapte Privit ca rezolutie: se unifica un scop cu o concluzie pi, rezulta inlocuirea cu - child(x))  boy(x) V -girl(x) V child(x) -i(yx-i(child(x) Л getstrain(x)) —> Vx-i(boy(x) Л good(x))) (-ichild(y) V -igetstra n(y)) Л boy(c) Л good(c) -boy(x)    -girl(x) V child(x) boy(c) : -girl(c) V child(c) Demonstratia e facuta a tine cont (sau intelege) predicatelor boy, child, good, etc : puteau fi P(x), Q(x), ?(x), Demonstratia e valabila pentru care satisfac ipotezele Exemplu de teorema: 0 defineste o Vx R(x, x) A VxVy( ?(x,y) —> R(y,x)) A VxVyVz( ?(x,y) A R(y, z) —>  ?(x, z)) —> VxVy(-i3z( ?(x, z) Л R(y, z)) V Vz(R(x,z) O  ?(y,z))) a multimii de definitie reflexivitate simetrie tranzitivitate clase disjuncte sau clase identice Teorema e adevarata indiferent de atribuita lui R(x,y) (indiferent de ) R ar putea fi (printre altele): c ef R(x,y) = x = у mod d (acelasi rest la impartirea cu d) c ef R(x,y) = length(x) = length(y) liste siruri de aceeasi lungime Definim mai precis ce inseamna o Formulele logicii predicatelor sunt definite structural recursiv variabila v sau constanta c ^(tl,       , in) cu f functie n-ara si ti,       , in termeni (well-formed formulas, formule bine formate): - - ,in) - О! O! —> (3 Vv O! tl = t2 cu P predicat n-ar; ti,       , in termeni unde a este o formula unde a,(3 sunt formule cu v variabila, а formula: cu ti, t2 termeni (in logica de ord 1 cu egalitate) in loc de propozitii avem (peste termeni) Ca in logica prepozitionala (si pentru orice limbaj), deosebim = forma, regulile dupa care construim ceva (aici, formule) = intelesul constructiilor de limbaj La fel ca in logic prepozitionala, lucram cu (demonstratia): procedeu pur sintactic (consecinta semantica): interpretam formula {intelesul ei, valoarea de adevar) Ne intereseaza corespondenta dintre aceste doua aspecte Regulile discutate sunt : manipuleaza forma {simboluri, nu intelesul lor) Regulile lui deMorgan: -i(a Vb) = ->aA ->b, -i(a Л Ь) = V o forma cu alta : formulele sunt echivalente : Daca un literal L e singur intr-o clauza: stergem toate clauzele din care apare stergem - ( 3 —> а) (А1-АЗ din logica prepozitionala) A2: (а -> ( 3 -> 7)) ((а -> V) -> (а -> 7)) АЗ: (-i З —> -іа) —> (а —>  3) А4: Ѵх(а —>  )—> (Ѵха —> Ѵх 3) А5: Ѵха —> а[х Ѵха daca х nu apare liber in а л A7- x — % in logica cu egalitate, adaugam si ' ,, A8: x = у —> а = p unde  3 se obtine din а inlocuind oricate din aparitiile lui x cu y *Definim: putem variabila x cu termenul t in Pyp daca: x nu apare liber in U pentru orice simbol de predicat n-ar P, o submultime Pi C Un (o relatie n-ara pe U) Deci, dam o interpretare fiecarui simbol din formula 0 interpretare nuda valori variabilelor (vezi ulterior: atribuire)  fx fy fz P(x, у) Л P(y,z) —> Р(х, z) tranzitivitate De exemplu: universul U = numere reale; predicatul P: relatia 3z P(x, z) A P(z,y) Gasiti o interpretare in care e adevarata si una in care e falsa ? Fie   о cu univers U si fie V multimea tuturor simbolurilor de variabile 0 este o functie s : V —> U (da fiecarei o din ) => din atribuirea s se poate obtine valoarea pentru orice (stim valoarea fiecarei variabile si intelesul fiecarei functii) interpretarea   da si intelesul fiecarui => putem calcula a unei formule -i, —> etc au intelesul cunoscut din logica prepozitionala trebuie definit intelesul (semantica) lui Spunem ca   xtp e adevarata in interpretarea   cu atribuirea s daca e adevarata inlocuind x cu valoare d G U din univers Un pentru o formula Vn G N P(n) aceasta forma ein logica de (cuantificare peste predicate) Poate fi definit ca o (o axioma pentru fiecare predicat), fara a cuantifica peste predicate Vx[P(0, x) Л ¥n(P(n, x) —> P(S(n), x)) —> VnP(n, x)] x: toate celelalte variabile de care depinde predicatul P Principiul inductiei matern : echivalent cu Orice multime nevida de nr naturale are un cel mai mic element Mai general: : demonstram proprietati despre obiecte tot mai complexe (pt obiecte definite inductiv recursiv) Teoria numerelor naturale cu adunare (aritmetica Presburger) e (orice putem exprima despre adunarea numerelor naturale e demonstrabil) Dar: nu putem exprima divizibilitate, numere prime, etc Aritmetica lui Peano (cu adunare si inmultire) e mai bogata dar e : sunt afirmatii despre care nu se poate decide daca sunt adevarate sau nu de incompletitudine: Orice sistem logic consistent care poate exprima aritmetica elementara e incomplet i e , se pot scrie afirmatii care nu pot fi nici demonstrate nici infirmate in acel sistem Demonstratie: codificand formule si demonstratii ca numere construim un numar care exprima ca formula sa e nedemonstrabila de incompletitudine: Consistenta unui sistem logic capabil sa exprime aritmetica elementara nu poate fi demonstrata in cadrul acelui sistem dar ar putea fi eventual demonstrata in alt sistem logic Pointeri Alocare dinamica Programarea calculatoarelor Curs 9 28 aprilie 2009 Marius Minea O variabila x de tipul tip are o &x de tipul Variabila x ocupa sizeof (x) (sau: sizeof (t p )) octeti pornind de la &x Adresele sunt nenule Valoarea null (adresa 0) indica o adresa invalida, in tip t ; numele t e tabloului (elem ) si are tipul Functiile au ca parametri nu continutul tabloului, ci tabloului, void f (t p t ); e la fel ca void f(t p t[J) si ca void f (t p * *t); Functia care primeste adresa unei variabile o poate (si citi) Ex: scanf (atribuie valori citite de la intrare), functii cu tablouri (modifica tabloului, dar nu , transmisa prin !) O "sir" are tipul Valoarea constantei "sir" este de memorie unde se afla sirul Nu putem compara un char (’a’) cu un sir (adresa) "a" ! Comparam siruri cu str(n)cmp, nu cu == (compara adrese, nu continut) : au tip, valoare, locin memorie, adresa, pot fi declarati, atribuiti, tipariti, dati parametri, au operatii specifice Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 3 Pointeri Alocare dinamica Pointer = o variabila care contine adresa altei variabile tip *nume var;    nume var e pointer la o valoare de tip operator prefix -operand: o variabila (ex x); rezultat: variabilei &x -folosit doar pt variabile (si elem tablou), nu constante, expresii, etc - se poate atribui unui pointer la acel tip: int x; int *p; p = &x; operator prefix - operand: pointer; rezultat: (variabila) indicat de pointer - *p e un , poate fi folosit la stanga unei atribuiri, ca si variabilele sau elem tablou; (orice poate fi la dreapta lui =) - daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, y, *p; p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) &*p e p (p: pointer cu valoare valida): adresa obiectului de la adresa p Programarea calculatoarelor Curs 9 Marius Minea Putem citi tip * p; tip * p; p are tipul tip * tip *p; *p e un caracter char **s;    adresa de adr de char char *t ;    tab de 8 adr de char CU Variabila int x = 5; int *p=&x; int **pp=&p; Adresa 0x408 0x51C 0x9D0 NU este o int t = { 3, 5 initializeaza t NU are sens: t - ( 3, Б ); int x, *p = &x; este int x; int *p = &x; sau int x; int *p; p = &x; (e initializat atribuit p, NU *p) *p - fex e incorect ca tip! char *p = "sir"; e char *p; p = "sir"; dar - "sir;" e gresit! * si & au mai ridicata decat operatorii aritmetici: у = *px + 1;    cu 1 mai mult decat valoarea indicata de px *  dar *px++ da valoarea indicata de px, si incrementeaza pointerul px (nu valoarea), pentru ca ++ si * se evalueaza de la dreapta la stanga ! Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica Folosirea e o in program ! { int sum; for (i=0; i++ in cel mai bun caz, o comportare aleatoare - cu unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie (vom discuta ulterior) : tip *p; *p = ceva; : char *p; scanf ("%s", p); - p este (eventual nul, daca e variabila globala) => valoarea va fi scrisa la o (evtl nula) => memorie corupta, vulnerabilitati de securitate, rulare abandonata ATENtiE: un pointer nu este un intreg Gresit: int *p - 640; ! Doar compilatorul sistemul de operare poate alege adresele, nu noi! Programarea calculatoarelor Curs 9 Marius Minea Avand adresa p a unei variabile Ti putem : *p = functia care primeste adresa unei variabile poate modifica valoarea ei ex scanf primete , completeaza cu valorile citite dar parametrii sunt transmisi : adresa nu se modifica void swap (int *pa, int *pb) {    schimba valorile de la 2 adrese int tmp;    variabila temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    trei atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim: - cand limbajul ne obliga (tablouri ca parametri la functii) - pentru a intoarce mai multe rezultate (functia permite doar unul) ex minimul maximul unui tablou; rezultat cod de eroare Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica Pointeri Alocare dinamica in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare - declararea unui tablou aloca un bloc de memorie pt elementele sale - numele tabloului e adresa blocului respectiv (= a primului element) declarand tip a[LEN], &a e echivalent cu a *pa; putem atribui pa = a; iar a e echivalent cu *a constanta (tabloul e alocat la o adresa fixa) Diferenta: adresa a e o =4" nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o are o adresa &pa variabila =s ocupa spatiu de memorie si adresa (hex) int a ; int *pa = Programarea calculatoarelor Curs 9 a; Marius Minea in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s[]); sau size t strlen(char *s); la diferente! char s [] = "test"; s e ’t’, s e ’  0’ etc s e o de tip char *, nu variabila cu loc in memorie NU se poate atribui s = se poate atribui s = ’f’ sizeof (s) e 5 * sizeof (char) &s e Chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) char *p = "test"; la fel: p e ’t’, p e ’ 0’ etc p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; si apoi p = ’f’ sizeof (p) e sizeof (char *) &p NU e p => e GREsiT: scanf ("%4s", &p); CORECT: scanf ("%4s", p); Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica Pointeri Alocare dinamica 10 O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou char *endptr(char *s) {  * returneaza pointer la sfarsitul lui s *  char *p = s;  * sau: char *p; p = s; *  while (*p) p++;  * adica la pozitia marcata cu ’ 0’ *  return p; 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , a n  0 0x5C4 > f e b  0 0x9FC d e c  0 p ocupa 12*sizeof(char *) octefi (+ 12*4 octefi pt constantele sir) p ="iulie" modifica o adresa (elementul 7 din tabloul de adrese p) Marius Minea t = e GREsiT (t e adresa constanta a liniei 7) Programarea calculatoarelor Curs 9 #include int main(int argc, char *argv[]) -{ printf("Numele programului: %s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element null (argvEargd) Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica Pointeri Alocare dinamica 14 Folosim pentru a lucra de fapt cu indicate prin adresa declarand un pointer tip *p avem loc doar pentru o NU si pentru un (variabila) de tip Declararea lui char *s; NU inseama si loc pentru a citi memora un sir! Pana acum am indicat prin pointeri doar variabile deja declarate: int x; int *p; p = &x; char a ; char *s; s = a+5;    s = &a ; Am declarat static doar tablouri de dimensiuni cunoscute si fixe (in C99 se permit dimensiuni variabile, evaluate la rulare) Nu putem dintr-o functie un tablou: el trebuie declarat in afara functiei, si adresa transmisa la functie care Ti completeaza (ex scanf, strcpy, functiile scrise pentru lucrul cu vectori matrici) Functiile de (stdlib h) permit sa creem variabile noi de dimensiuni necesare aparute la rularea programului void *malloc (size t size); aloca size octeti void *calloc (size t num, size t size); num*size octeti init CU 0 - returneaza adresa de inceput unde a fost alocat nr dat de octeti sau null la eroare (ex mem insuficienta) =4" unei zone alocate cu c maiioc: void *reaiioc(void *ptr, size t size); modifica marimea la size - poate returna alta adresa decat ptr, atunci muta continutul existent => Ex if (pl = realloc(p, size)) {p= pl;  * apoi folosim p *  } Memoria alocata dinamic void free(void *ptr); cand nu mai e necesara elibereaza memoria alocata cu c maiioc int i, n, *t; printf("Nr de elemente ?"); scanf("%d", &n); if ((t = malloc(n * sizeof(int))) != NULL) for (i = 0; i #include #define BLOCK 16 char *getline(void) { char *p, *s = NULL;    s initializat pentru realloc int c, lim = -1, size =0;    pastram un loc pentru  0 while ((c = getcharO) != EOF) { if (size >= lim)    s-a umplut zona alocata if (!(p = realloc(s, (lim+=BL0CK)+1))) {    mai aloca 16 ungetc(c, stdin); break;    termina daca nu mai e loc } else s = p;    tine minte noua adresa alocata s[size++] = c;    adauga ultimul caracter if (c == ’ n’) break;    iese la linie noua }    termina cu  0, realoca doar cat e nevoie if (s) { s[size++] = ’ 0’; s = realloc(s, size); } return s; Programarea calculatoarelor Curs 9 Marius Plinea e necesara cand stim dinainte de cata memorie e nevoie NU: int *px; px = malloc (sizeof (int)); scanf ("%d" , px); Mai Simplu: int x; scanf("%d", &x); , cand nu stim de la compilare cata memorie e necesara (tablouri cu dimensiuni aflate la rulare, liste, arbori, etc ) , cand trebuie sa returnam un obiect nou creat dintr-o functie (NU putem returna adresa de var locala, memoria dispare la revenire!) char *strdup(const char *s) t    creeaza copie a lui s char *d = malloc(strlen(s) + 1);    loc pentru sir si ’ 0’ return d ? strcpy(d, s) : NULL;    fa copia, returneaza d , cand trebuie pastrat un obiect citit intr-un loc temporar char *tab , buf ; while (i 0) =4" foloseste argumente void * fiind compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *);  tip ptr fct cmp int intcmp(int *pl, int *p2) { return *pl - *p2; }  fct cmp intregi int tab = t -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sorteaza crescator Programarea calculatoarelor Curs 9 Plarius Plinea Pointeri in limbajul C, orice variabila are o : o valoare numerica; indica locul din memorie unde e memorata valoarea variabilei da adresa operandului: &x e adresa variabilei x Operandul: orice poate folosit pe partea stanga a unei atribuiri (variabila, element de tablou, functie; NU pentru expresii oarecare) O adresa poate fi tiparita (in hexazecimal) cu formatul %pin printf 30 noiembrie 2004 Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 3 #include double d; int a ; int main(void) int k; printf("Adresa printf("Adresa printf("Adresa printf("Adresa }  * Obs &a -  * variabile globale *  variabila locala *  7"p n", &d);  * de &a ); &a );  * d: a : 7"p n' a : 7"p n' k: 7"p n", &k) ; lui lui lui lui &a == 5 * sizeof(int) Utilizarea si programarea calculatoarelor Curs 9 Pointeri ex 0x80496c0 *  0x80496e0 *  0x80496f4 *  0xbffff8e4 *  (pozitii consecutive) *  Marius Minea Orice expresie in C are un tip => la fel si expresiile adresa : Daca variabila x are tipul tip, &x are tipul tip * int x; =t &x are tipul int *, adica pointer la int (adresa de int) char c; => ftc are tipul char *, (pointer la char, adresa de char) => exista tipuri de adresa diferite pentru fiecare tip de date => putem variabile de aceste tipuri (pointeri): tip * numc var; nume var e pointer la (adresa pt ) o valoare de tip = o variabila care contine adresa altei variabile da obiectul *p de la adresa data de operandul p Operand: pointer Rezultat: referinta la obiectul indicat de pointer => operator de indirectare (dereferentiere, referire indirecta prin adresa) : Daca pointerul p are tipul tip *, *p are tipul tip Sintaxa declaratiei (aceeasi dar citita in doua feluri) sugereaza folosirea: char* p; p e o variabila de tipul char * (adresa de char) char *p; *p (obiectul de la adresa p) are tipul char Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointerii au adrese, ca orice variabile: pt int *p; adresa &p are tipul int ** int ** pp = &p; => pp are tipul int **, adica adresa unei adrese de int dar putem citi int* *pp sau int **pp deci *pp are tipul int * (adresa de int) si **pp are tipul int (val de la adr *pp) inainte de folosire, un pointer trebuie variabile de tipul potrivit: int x, *p, **pp; p = &x; pp = &p; O *p poate fi folosita (in cazul de mai sus, *p se foloseste absolut la fel (sinonim) cu x) int x, y, z, *p; p = &x; z=*p;  * z = x *  *p=y;  * x = у *  : Operatorii adresa & si de indirectare * sunt : *&x este chiar x, pentru orice obiect (variabila) x &*p are valoarea p, pentru orice variabila pointer p (dar p e o variabila si poate fi atribuita; &*p e o expresie si nu poate) Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri Pointeri 6 Utilizarea oricarei variabile neinitializate e o eroare logica in program ! { int x; printf ("7>d", x); }   * cat e x ?? valoare la intamplare! *  , ca orice variabile i - cu adresa unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie alocata dinamic (vom discuta ulterior) : tip *p; *p = valoare; p este !! (eventual nul) => valoarea va fi scrisa la o adresa de memorie necunoscuta (evtl nula) => coruperea memoriei, rezultare eronate sau imprevizibile, terminarea fortata a programului (sub sisteme de operare cu memorie protejata) definitin stddef h ca (void *)0: nu e o adresa valida => folosit (la initializari, sau returnat) ca valoare de pointer invalid : pointerii au valori numerice, dar nu sunt acelasi lucru ca intregii => Nu convertiti intre pointer si int (e dependent de implementare) : Un prim test al corectitudinii programului: Verificati ca expresiile au tipuri corespunzatoare (ex la atribuire) => valabil si pentru pointeri (nu confundati p cu *p, etc ) Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Permit prin transmiterea adresei ei - o variabila se poate modifica prin indirectarea unui pointer catre ea - nu se modifica adresa (transmisa tot prin valoare) ci continutul ei void swap (int *pa, int *pb)  * schimba val de la adr pa si pb *  { int tmp;  * variabila auxiliara necesara pentru interschimbare *  tmp = *pa; *pa = *pb; *pb = tmp;  * trei atribuiri de intregi *  }  * in functie s-a lucrat cu continutul de la adresele pa si pb *  Ex : int x = 3, у = 5; swap(&x, &y);  * acum x = 5 si у = 3 *  : Nu se poate obtine efectul cu void swap(int m, int n); (ar schimba valorile transmise in corpul functiei, fara efect in afara) Folosire: cand limbajul nu permite transmiterea prin valoare ( ) sau ar fi ineficienta (structuri mari) =t transmitem adresa variabilei Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri Pointeri in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare Declararea unui tablou aloca un bloc de memorie bt elementele sale => blocului resoectiv (= a orimului element) => oentru tabloul tip a[LEN]; numele a e o de tipul tip * fta e echivalent cu a (adresa tabloului e adresa primului element) a e echivalent cu *a (obiectul de la adresa a e primul element) Daca declaram tip *pa; putem atribui pa = a; Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu de memorie si are o adresa &pa int a ; int *pa = a; Marius Minea in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s[]); sau size t strlen(char *s); (de fapt, compilatorul converteste prima varianta in a doua) size t: tip pt dimensiuni pozitive din stddef t (ca si unsigned sauunsigned long) => nu se transmit tablouri (bloc de memorie) la functii, ci adresele lor Fie char t ; Compilatorul considera ftt ca fiind t => s-ar putea scrie si scanf ("7,20s", ftt) in loc de scanf ("7,20s", t) se recomanda totusi prima varianta, pentru uniformitate cu cazul: char *p; p = s; scanf ("7,20s", p)  * aici e incorect &p i *  Diferenta intre tablouri si pointeri: sizeof t == 21*(sizeof char) diferit de sizeof p == sizeof (char *) Atentie! Verificati corespondenta tipurilor in expresii Ex char m ; char *p; p si m nu au acelasi tip, dar p si m au ! Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri Pointeri 10 O variabila v de un anumit tip ocupa sizeof(tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof(tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou a + i e echivalent cu &a[i] iar *(a + i) e echivalent cu a[i] char *endptr(char *s) {  * returneaza pointer la sfarsitul lui s *  char *p = s;  * sau: char *p; p = s; *  while (*p) p++;  * adica la pozitia marcata cu A0* *  return p; } 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, l=, 0 pt sl>s2, 0 pt egal *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 11 char *strncpy(char *dest, const char *src, size t n) { char *p = dest;  * copiaza cel mult n caractere *  while (n— && *p++ = *src++); return dest; int strncmp (const char *sl, const char *s2, size t n) { if (n == 0) return 0;  * compara pe lungime cel mult n *  while (—n && *sl == *s2 && *sl) { sl++; s2++; } return *sl - *s2;  * 0 pt sl>s2, 0 pt egal *  char *strchr(const char *s, int c) {  * cauta primul c in s *  do if (*s == c) return s; while (*s++); return NULL;  * daca nu a fost gasit *  } void *memset(void *s, int c, size t n);  * seteaza n octeti cu c *  void *memcpy(void *dest, const void *src, size t n); void *memmove(void *dest, const void *src, size t n);  * copiaza n octeti; ultima varianta si pentru zone suprapuse *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 12 Fie declaratia tip a[DlMl] [DiM2]; Elementul a[i] [j] este al j-lea element din tabloul de dih2 elemente a[i] si are adresa fca[i] [j] == (tip *)(a + i) + j == (tip *)a + DiH2*i + j => pentru compilarea expresiei a[i] [j] e necesara cunoasterea lui dih2 => in declaratia unei functii cu parametri tablou trebuie precizate toate dimensiunilein afara de prima (irelevanta): void f(int m[][s]); Declaratiile char s[] = "sir"; si char *s = "sir"; sunt diferite! - prima rezerva spatiu doar pt sirul "sir", iar adresa s e o constanta - a doua rezerva spatiu si pentru pointerul s, care poate fi reatribuit char s = {"ian", "dec"}; si char *s ={"ian", "dec"}; primul e un tablou 2-D de caractere, al doilea e un tablou de pointeri Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 13 Pointeri 14 Limbajul C permite accesul la parametrii argumentele) cu care programul e rulat din linia de comanda (ex optiuni, nume de fisiere) De asemenea, permite returnarea de program a unui cod intreg (folosit uzual pentru a semnala succes sau o conditie de eroare) #include int main(int argc, char *argv[]) { int i; printf("Numele programului: %s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (i = 1; i = 1 - argv[l], etc : parametrii, asa cum au fost separati de spatii Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Adresa unei functii se poate obtine, memora, si utiliza pentru a o apela, pentru o functie tip-rez fct (tipl, , tipn); adresa are tipul tip raz (*pfct) (tipl, , tipn); se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Atentie la sintaxa: int *fct(void); declara o functie ce returneaza pointer la intreg int (*fct) (void); declara un pointer la o functie ce returneaza intreg Exemplu de utilizare: parametrizarea unei alte functii Algoritmul quicksort, declarat (in stdio h) ca functie cu parametrii: - adresa tabloului de sortat, numarul si dimensiunea elementelor - adresa functiei care compara 2 elemente (returneaza 0) efectuarea compararii depinde de tip: intreg, sir, definit de utilizator void qsortfvoid *base, size-t nun, size-t size, int ( compar)(void *, void *)); - foloseste argumente void * fiind compatibile cu pointeri la orice tip Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 15 Pointeri 16 - pentru tabele de rutine, apelate in functie de un indice - exemplu: meniu cu apelare de functii in functie de tasta apasata void help(void); void menu(void);  * *  void quit(void); void (*funtab) (void) = { help, menu, quit }; void do cmd(void) int к = getcharO - ’0’; if (k >= 0 && к e util sa declaram un tip: typedef void (*funptr)(void);  * pointer la functie void *  funptr funtab ;  * tabloul de pointeri de functie *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pana acum am atribuit la pointeri doar adrese de variabile existente si am declarat static doar variabile de dimensiuni cunoscute la compilare Discutam: functii de gestiune dinamica a memoriei (stdlib h): alocarea memoriei dupa necesitati stabilite la rularea programului void *malloc(size t size);  * aloca size octeti *  void *calloc(size t num, size t size);  * num*size oct init 0 *   * m calloc returneaza NULL la eroare (ex mem insuficienta) *  void *realloc(void *ptr, size t size);  * modifica dimensiunea, poate muta blocul, dar pastreaza continutul memoriei *  void free(void *ptr);  * elibereaza mem alocata cu c malloc *  int i, n, *t; printf("Nr de elemente ?"); scanf("%d", &n); if ((t = malloc(n * sizeof(int)) != NULL) for (i = 0; i #include #define NUM 100  * alocam pt 100 de numere odata *  typedef int (*cmpptr)(const void *, const void *); int cmp(int *p, int *q) { return *p - *q; }•  * pt sortare *  void main(void) { int i = 0, n = 0, *t= NULL;  * contor, total, tablou *  do {  * aloca cate NUM intregi, initial si cand e nevoie *  if (i == n) •{ n += NUM; t = realloc(t, n*sizeof (int)); } scanf("%d", &t [i]);  * realloc(NULL,sz) e ca si malloc(sz) *  }• while (t [i++]); qsort(t, i, sizeof(int), (cmpptr)cmp);  * sorteaza *  for (n = 0; n metoda diferita de simulare sau testare Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Analiza fluxului de date 3 Analiza fluxului de date Analiza programelor e legata tot mai mult de verificarea formala Verificarea formala: stabileste ca un sistem e corect prin analiza riguroasa a unui model matematic al sistemului -in general, proprietati specifice, detaliate despre comportament (ex dupa evenimentul A apare evenimentul В etc ) - necesita in principiu analiza (simbolica) a secventelor de executie a modelului (explorarea spatiului starilor) Analiza statica: bazata tot pe tehnici matematice, riguroase - de regula pentru proprietati mai generale - folosind aproximatii sigure (conservatoare) - de regula nu exploreaza spatiul starilor programului - Analiza fluxului de date principalele tehnici originare din domeniul compilatoarelor aspecte legate de dualitatea precizie   eficienta - Analiza bazata pe constrangeri cadru general pentru reprezentarea prin relatii de constrangere intre multimi, cu proceduri eficiente si generice de solutionare - interpretare abstracta simplifica programul prin definirea unei semantici care considera doar aspectele relevante pentru proprietatea dorita - Sisteme de tipuri definind sistem corespunzator de tipuri, multe proprietati pot fi convertite la probleme de inferenta   verificare a tipurilor Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Analiza fluxului de date 5 Analiza fluxului de date Tehnici cu originea in domeniul compilatoarelor - folosite pentru generarea de cod (alocarea de registri) - si optimizarea de cod (propagarea constantelor, factorizarea expresiilor comune, detectarea variabilelor nefolosite, etc ) Ulterior, unificate intr-un cadru general care permite aplicarea si la alte probleme de analiza de cod Abordarea de baza: - construirea grafului de flux de control al programului - urmarirea modului in care proprietatile de interes se modifica pe parcursul programului (la traversarea nodurilor   muchiilor grafului) Reprezentare in care: - nodurile sunt instructiuni - muchiile indica secventierea instructiunilor (inclusiv salturi) => putem avea: noduri cu: - un singur succesor (ex atribuiri), - mai multi succesori (instructiuni de ramificatie) - mai multi predecesori (reunirea dupa ramificatie) Obs : Alternativ, dar mai putin folosit: - nodurile sunt puncte din program (valori pentru PC) - muchiile sunt instructiuni cu efectele lor Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Analiza fluxului de date Analiza fluxului de date G = (N E) : graful de flux de control ( № : noduri; E : muchii) s : o instructiune de program (nod in graful de flux de control) entry, exit: punctele de intrare si de iesire din program fn(s) : multimea muchiilor care au s ca destinatie out(s) : multimea muchiilor care au s ca sursa src(e), dest(e) : instructiunea sursa si destinatie a muchiei e pred(s) : multimea predecesorilor instructiunii s succ(s) : multimea predecesorilor instructiunii s Cu aceste notiuni scriem ce descriu cum se modifica valorile analizate (dataflow facts) de la o instructiune la alta Notam cu indicii jn si cut valoarea analizata la intrarea si respectiv iesirea din instructiunea s Verificare formala Curs 9 Marius Minea Care sunt toate atribuirile (definitiile) care pot atinge punctul curent (inainte ca valorile atribuite sa fie suprascrise) ? Elementele de interes sunt perechi: (variabila, linie de definitie) Pentru fiecare instructiune (identificata cu eticheta ei i) ne intereseaza valoarea dinainte RDjn(s) si de dupa RDout(s) - nodul initial din graf nu e atins de nici o definitie: RDout{entry) = {(",?) |"6V} - o atribuire l v   r: sterge toate definitiile anterioare pentru variabila v (dar nu pt alte variabile) si o introduce pe cea curenta RDoutV : v inM = Us'epred(A) RDou№} Verificare formala Curs 9 Marius Minea Analiza fluxului de date 9 Analiza fluxului de date in fiecare punct de program, care sunt variabilele ale caror valoare va fi folosita pe cel putin una din caile posibile din acel punct ? (analiza utila in compilatoare pentru alocarea registrilor) Functia de transfer: LV-in(s) = (LVout(s)   write(s)) и read(s) (o variabila e live inainte de s daca e citita de s, sau e live dupa s fara a fi scrisa de s) => sensul analizei e inapoi Operatia de combinare (meet): 0 daca succ(s) = 0 LV^out(s) - | UyeSucc(s) V em(s') altfel => combinarea facuta prin uniune (may, pe cel putin o cale) Calculul: algoritm de tip worklist care face modificari pornind de la valorile initiale pSna nu mai apar schimbari => se atinge un Verificare formala Curs 9 Marius Minea in fiecare punct de program, care sunt expresiile a caror valoare a fost calculata anterior, fara sa se modificat, pe toate caile spre acel punct? (daca valoarea se tine minte intr-un registru, nu trebuie recalculata) Functia de transfer: AEout(s) = (AEjn(s)   {e | V(e) n write(s) 0}) U{e 6 Subexp(e) | V(e) П write(s) = 0} (expresiile de la intrarea in s care nu au variabile modificate de s, si orice expresii calculate in s fara a li se modifica variabilele) Operatia de combinare (meet): , f 0 daca pred(s) = 0   t flyepredw -4 out(S') altfel => combinarea e facuta prin intersectie (must, pe toate caile); analiza e inainte Verificare formala Curs 9 Marius Minea Analiza fluxului de date 11 Analiza fluxului de date 12 Care sunt expresiile care trebuie evaluate pe orice cale din punctul curent inainte ca valoarea vreunei variabile din ele sa se modifice ? => evaluarea se poate muta in punctul curent, inainte de ramificatii - o analiza inapoi, si de tip universal (must) VBEin(s) = (VBEout(s)   {e | V(e) П write(s) 0}) U Subexp(s) VRF 0 dac3 5UCCM =   VBE0ut^) - t nyeSUccW VBEintf) altfel : analizam diverse proprietati, de ex - valoarea unei variabile intr-un punct de program - sau intervalul de valori pentru o variabila - sau multimi de variabile (live), expresii (available, very busy), definitii posibile pentru o valoare (reaching definitions), etc : o multime D de valori pentru o proprietate (dataflow facts) Restrictie: D e o multime Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Analiza fluxului de date 13 Analiza fluxului de date - am asociat cu punctele de program multimi de valori pentru proprietatea analizata - am recalculat iterativ multimile respective, prin operatii de reuniune sau intersectie; obtinand tot mai multe (sau mai putine) valori Care sunt premisele esentiale pentru a efectua calculele in acest fel ? : О (Д E) e o multime echipata cu o ec L x L, adica o relatie: - reflexiva, x E x pentru orice x 6 L - tranzitiva, а; E у л у E z x E z, pentru orice a:, y, z 6 L - antisimetrica: ж E у л у E ж => ж = у, pentru orice ж, у е L Exemplu: multimea partilor ('P(-D) C) sau ('Р(-О) Э) Latice (completa) = o multime partial ordonata in care orice submultime finita are un cel mai mic majorant (least upper bound) si cel mai mare minorant (greatest upper bound) l0 e majorant al lui Y c L daca Vi 6 Y avem l E l0 io e minorant al lui Y c L daca Vi e Y avem !q e l Notam: Ui’: cel mai mic majorant al multimii Y C L |""|Y: cel mai mare minorant al multimii YC L 5І± = и0=Пь Т=П0 = иЬ Definim atunci operatiile meet : x п у = П{г у} join ; X u у = U{;r, у} (in cazul multimii partilor: intersectie, reuniune) Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Analiza fluxului de date Analiza fluxului de date 16 Operatiile n (meet) si u (Join) au proprietatile: - sunt comutative - sunt asociative - П ± = ± si U T = T, pentru ОГІСв Latice distributiva' in care operatorii n si u sunt reciproc distributivi: X n (y u z) = (ж n y) u (r n z) X U (у П z) = (r U у) П (r U z) Verificare formala Curs 9 Marius Minea : instructiunile determina modificari ale starii programului Valoarea unei variabile dupa o instructiune e o functie a valorii de la inceputul instructiunii : Fiecare instructiune s are asociata o functie de transfer F(s) : L —? L care determina modul in care valoarea proprietatii la inceputul instructiunii e modificata de instructiune: Propout(s) = F(s)(Prop!n(s)) (pentru analize inainte), sau invers (pentru analize inapoi) Restrictie: punem conditia ca functiile de transfer sa fie monotone' xCy=y f(x) E f(y) (daca stim mai multe despre argument, atunci si despre rezultat) Caz particular: bitvector frameworks' laticea e o multime de parti P(D), functii de transfer monotone si de forma: F(s)(v) = (v   A-tfi(s)) U gen(s) (v = dataflow fact, gen kill(s) = informatia generata eliminata in s) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 17 Analiza fluxului de date 18 Exemplu: pentru analize inainte: Pr°PoutM = F(s)(Prop!n(s)) Propin(S) = Г 5,ЕргесІЫ Prop0ut(er) unde prin П am reprezentat efectul combinarii informatiilor (meet) pe mai multe cai (ar putea fi n sau u) initial, e cunoscuta valoarea Prop0ut(entry) Pentru analize inapoi, se schimba rolul intre in si out, si e cunoscuta valoarea lui Prop-in(exit) Pentru calculul solutiei la sistemul de ecuatii de mai sus: algoritmi iterativ care propaga modificarile in sensul analizei foreach s e N do Prupjn(s) = T  * no info *  Prupin(entry) = init  * in functie de analiza *  iV = {entry} while iV 0 choose s с iV iV = iV   {"} Propus) = ns combinarea diverselor cai de executie nu pierde informatie Cele 4 exemple date (live variables, etc ) sunt distributive Verificare formala Curs 9 Marius Minea Analiza fluxului de date 21 Analiza fluxului de date 22 - inainte sau inapoi - must sau may - dependente sau independente de fluxul de control (flow (in)sensitive): Trebuie luata in considerare ordinea instructiunilor in program - nu: ce variabile sunt folosite modificate, functii apelate, etc - da: proprietati legate de valorile calculate efective de program - dependente sau independente de context in cazul programelor ce contin proceduri: e specializata analiza fiecarei proceduri in functie de locul de apel, sau se poate face un sumar (o analiza comuna) ? Modelarea programelor cu proceduri: in graful de flux de control, un - muchie de la locul de apel la inceputul procedurii - muchie de la sfarsitul procedurii la instructiunea de dupa apel in felul acesta, se obtin toate caile, dar si cai nefezabile => se restrange analiza asupra cailor realizabile, in care apelurile si reintoarcerile din functii sunt imperecheate corect Verificare formala Curs 9 Marius Minea Verificare formala Curs 9 Marius Minea Programarea calculatoarelor Pointeri Marius Minea 22 aprilie 2008 Programarea calculatoarelor Curs 9 Marius Minea O variabila x de tipul tip are o &x de tipul Variabila x ocupa sizeof (x) (sau: sizeof (t p )) octeti pornind de la &x Adresele sunt nenule Valoarea null (adresa 0) indica o adresa invalida, in tip t ; numele t e tabloului (elem ) si are tipul Functiile au ca parametri nu continutul tabloului, ci tabloului, void f (t p t ); e la fel ca void f(t p t[J) si ca void f (t p *t); Functia care primeste adresa unei variabile o poate (si citi) Ex: scanf (atribuie valori citite de la intrare), functii cu tablouri (modifica tabloului, dar nu , transmisa prin !) O "sir" are tipul Valoarea constantei "sir" este de memorie unde se afla sirul Nu putem compara un char (’a’) cu un sir (adresa) "a" ! Comparam siruri cu str(n)cmp, nu cu == (compara adrese, nu continut) : au tip, valoare, locin memorie, adresa, pot fi declarati, atribuiti, tipariti, dati parametri, au operatii specifice Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 3 Programarea calculatoarelor Pointeri Pointer = o variabila care contine adresa altei variabile tip *nume var;    nume var e pointer la o valoare de tip operator prefix -operand: o variabila (ex x); rezultat: variabilei &x -folosit doar pt variabile (si elem tablou), nu constante, expresii, etc - se poate atribui unui pointer la acel tip: int x; int *p; p = &x; operator prefix - operand: pointer; rezultat: (variabila) indicat de pointer - *p e un , poate fi folosit la stanga unei atribuiri, ca si variabilele sau elem tablou; (orice poate fi la dreapta lui =) - daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, y, *p; p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) &*p e p (p: pointer cu valoare valida): adresa obiectului de la adresa p Programarea calculatoarelor Curs 9 Marius Minea Putem tip * tip char char citi p; *p; tip * P; p are tipul tip * *p e un caracter adresa de adr de char *t ;    tab de 8 adr de char NU este o Variabila int x = 5; int *p=&x; int **pp=&p; Adresa 0x408 0x51C 0x9D0 int x = 5; e la fel CU int x; x = 5; int t = { 3, 5 }; dar t - (3, 5 ) NU are sens! int x, *p = &x; este int x; int *p = &x; sau int x; int *p; p = &x; (e initializat atribuit p, NU *p) p - x e incorect ca tip! char *p = "sir"; e char *p; p = "sir"; dar *p - "sir;11 e gresit! * si & au mai ridicata decat operatorii aritmetici: у = *px + 1;    cu 1 mai mult decat valoarea indicata de px *  dar *px++ da valoarea indicata de px, si incrementeaza pointerul px (nu valoarea), pentru ca ++ si * se evalueaza de la dreapta la stanga ! Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri Programarea calculatoarelor Pointeri Folosirea e o in program ! { int sum; for (i=0; i++ in cel mai bun caz, o comportare aleatoare - cu unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie (vom discuta ulterior) : tip *p; *p = ceva; : char *p; scanf ("%s", p); - p este (eventual nul, daca e variabila globala) => valoarea va fi scrisa la o (evtl nula) => memorie corupta, vulnerabilitati de securitate, rulare abandonata ATENtiE: un pointer nu este un intreg Gresit: int *p - 640; ! Doar compilatorul sistemul de operare poate alege adresele, nu noi! Programarea calculatoarelor Curs 9 Marius Minea Avand adresa p a unei variabile Ti putem : *p = functia care primeste adresa unei variabile poate modifica valoarea ei ex scanf primete , completeaza cu valorile citite dar parametrii sunt transmisi : adresa nu se modifica void swap (int *pa, int *pb) {    schimba valorile de la 2 adrese int tmp;    variabila temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    trei atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim: - cand limbajul ne obliga (tablouri ca parametri la functii) - pentru a intoarce mai multe rezultate (functia permite doar unul) ex minimul maximul unui tablou; rezultat cod de eroare Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri Programarea calculatoarelor Pointeri in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare - declararea unui tablou aloca un bloc de memorie pt elementele sale - numele tabloului e adresa blocului respectiv (= a primului element) declarand tip a[LEN], *pa; putem atribui pa = a; &a e echivalent cu a iar a e echivalent cu *a Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) =4" nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu de memorie si are o adresa &pa int a ; int *pa = a; Programarea calculatoarelor Curs 9 Marius Minea in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s[]); sau size t strlen(char *s); la diferente! char s [] = "test"; s e ’t’, s e ’  0’ etc s e o de tip char *, nu variabila cu loc in memorie NU se poate atribui s = se poate atribui s = ’f’ sizeof (s) e 5 * sizeof (char) &s e Chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) char *p = "test"; la fel: p e ’t’, p e ’ 0’ etc p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; sl apoi p = ’f’ sizeof (p) e sizeof (char *) &p NU e p => e GREsiT: scanf ("%4s", &p); CORECT: scanf ("%4s", p); Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Po'nteri Programarea calculatoarelor Pointeri 10 O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou char *endptr(char *s) {  * returneaza pointer la sfarsitul lui s *  char *p = s;  * sau: char *p; p = s; *  while (*p) p++;  * adica la pozitia marcata cu ’ 0’ *  return p; 2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , a n  0 0x5C4 > f e b  0 0x9FC d e c  0 p ocupa 12*sizeof(char *) octefi (+ 12*4 octefi pt constantele sir) p ="iulie" modifica o adresa (elementul 7 din tabloul de adrese p) Marius Minea t = e GREsiT (t e adresa constanta a liniei 7) Programarea calculatoarelor Curs 9 #include int main(int argc, char *argv[]) -{ printf("Numele programului: %s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element null (argvEargd) Programarea calculatoarelor Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 29 noiembrie 2004 Programarea calculatoarelor 2 Curs 9 Marius Minea implicit, obiectele declarate la nivel de fisier sunt intr-un program (doua declaratii ale aceluiasi identificator in fisiere diferite reprezinta , v curs 3) => obiectul va fi intr-un singur fisier, in toate fisierele ce-l utilizeaza Declaratii care nu sunt definitii: - pentru variabile: cu specificatorul - pentru functii, doar prototipul (antetul), nu si corpul functiei Fazele compilarii: - compilarea in fisiere c -> o (cod masina, dar contine inca nume de variabile in loc de adrese fixe) - editarea de legaturi (linkeditarea): referintele la un identificator ( ) din toate fisierele obiect inlocuite prin aceeasi adresa Obiectele cu specificatorul nu sunt vizibile in afara fisierului => acelasi identificator poate fi refolosit pentru obiecte diferite Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate Tipuri de date abstracte Recursivitate - cate un fisier pentru portiunile de cod care formeaza o entitate logica - cu un minim de interactiune (fara variabile globale nenecesare, etc ) - declaratiile de tipuri, functii si variabile ce trebuie exportate se pun intr-un fisier antet h - acesta e inclus de fiecare fisier c care Ti necesita - pentru a nu include declara in duplicat, se poate incadra in #ifndef FiSiERULMEU H #define FiSiERULMEU H  * aici vine continutul propriu-zis *  #endif chiar daca fisierul h e inclus repetat (din mai multe locuri), continutul sau e prelucrat doar o data (cand identificatorul ales nu e definit) TDA = un model matematic cu un set de operatii asupra lui => o structura de date + functii care opereaza pe ea => notiunea de din programarea orientata pe obiecte Pentru implementarea TDA in C: - in fisierul h se declara minimul necesar pentru a putea compila programul (pentru structuri, adesea doar un typedef pt pointer la tip) - si declaratii de functii care manipuleaza tipul respectiv - structura tipului si definitiile functiilor: ascunse in implementare ( c) typedef struct node *list t;  * in fisierul h *  typedef struct node {  * in fisierul c cu implementarea *  int info;  * sau si alte campuri *  struct node *nxt; } node t;  * tip vizibil doar in fisierul c *  - utilizatorul, care include doar fisierul h nu are acces la structura interna a tipului (node t); accesul e permis doar prin functii care citesc sau modifica componentele unei variabile de acest tip (ca si pt file) Programarea calculatoarelor 2 Curs 9 Marius Minea Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 5 Tipuri de date abstracte Recursivitate Spre programarea orientata pe obiecte: - : fara acces direct la reprezentarea TDA, componentele sale sunt accesate doar prin functii - functiile au de regula ca prim parametru obiectul pe care opereaza (sau pointer la el) - similar cu apelate pentru un obiect Decizii de proiectare: - ce operatii ca fie incluse - daca se transmit obiecte sau doar pointeri la obiecte (pointerii sunt necesari pentru functii care modifica obiectul) - daca rezultatul unei operatii e returnat (eventual alocat dinamic), sau depus intr-un obiect specificat (deja alocat) transmis ca parametru - daca functia returneaza un obiect, sau un cod de succes eroare (si obiectul e depus la adresa data de un pointer parametru) Vezi exemplele de cod pentru: numere complexe, matrici, multimi Programarea calculatoarelor 2 Curs 9 Marius Minea Codul se scrie natural pornind de la definitia recursiva a structurii: Ex o lista este vida sau un element urmat de o lista Se pot defini atunci: - membrw e primul element, sau membru in coada listei - sterge: primul element, sau sterge din coada listei, etc La fel, se pot defini recursiv functii care copiaza sau transforma liste Productiile din gramatica unui limbaj sunt tipic recursive: expresie ::= termen | expresie + termen | expresie - termen termen ::= factor | termen * factor | termen   factor factor ::= numar | ( expresie ) Primele doua productii sunt recursive la stanga, pentru ca neterminalul din partea stanga a lui ::= apare si ca prim element intr-o varianta => se pot transforma si implementa (vezi exemplu) folosind cicluri Programarea calculatoarelor 2 Curs 9 Marius Minea Fisiere Fisiere Ca , de calculatoare, ne referim la un fisier prin Ca , ne intereseaza accesul la continutul fisierului, un sir (flux) de octeti (engl stream) in stdio h: tipul cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF), in program, lucram cu variabile transmise functiilor pt fisiere, (nu le dereferentiem niciodata, le folosim doar pt a indica fisiere) Secventa tipica de lucru: se deschide, se prelucreaza, seinchide fisierul Fisiere standard predefinite (deschise automat la rularea programului): : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) (sunt constante de tipul file * declarate in stdio h) De fapt, scanf printf etc fac citire scriere (de) la stdin stdout Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pt a putea fi separate (prin redirectare) de mesajele normale de iesire Utilizarea si programarea calculatoarelor Curs 9 Marius Minea FiLE *fopen (const char *path, const char *mode); - arg 1: numele fisierului (absolut sau fata de directorul curent) - arg 2: modul de deschidere; primul caracter semnifica: : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, e trunchiat la 0 (w) sau se adauga la sfarsit (append, a) in plus, sirul de caractere pt modul de deschidere mai poate contine: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod (implicit: in mod ) - returneaza null in caz de eroare (trebuie testat ii!) - altfel, valoarea returnata se foloseste pt lucrul in continuare int fcloseCFiLE *stream); - scrie orice a ramas in tampoanele de date, inchide fisierul - returneaza 0 in caz de succes, EOF in caz de eroare Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 3 Fisiere Tipar pt lucrul cu fisiere (ex deschis pt citire si scriere in mod text) FiLE *fp; char *name = "f txt";  * sau din argv[], sau solicitat *  if (l(fp = fopenfname, "rt+"))) {  * trateaza eroarea *  } else {  * lucreaza cu fisierul *  } if (fclose(fp))  * eroare la inchidere * ; La intrarea-iesirea in mod se pot petrece diverse conversii in functie de implementare (de exemplu traducere  nin  r n pt DOS) - modul : doar pt fisiere cu caractere tiparibile obisnuite ,  t,  n - modul binar: pt toate celelalte situatii (chiar si pt fisiere text) (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc , care e avansat automat de fiecare operatie => trebuie repozitionat corespunzator indicatorul cand trecem intre citire si scriere in acelasi fisier Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (fflush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Cu functii echivalente celor folosite pana acum: int fpute(int c, FiLE *stream);  * scrie caracter in fisier *  int fgete(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s);  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ o> la sfarsit =s  citirea sigura a unei linii, fara depasire returneaza null daca apare eof inainte de a fi citit ceva Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 5 Fisiere #include void cat(FiLE *fi)  * afiseaza un fisier deschis caracter cu caracter *  { int c; while ((c = fgetc(fi)) != EOF) putchar(c); } void main(int argc, char *argv[]) •  FiLE *fp; if (argc == 1) cat(stdin);  * citeste de la intrare *  else while (—argc >0) {  * pt fiecare argument *  if (!(fp = fopen(*++argv, "r")))  * deschide, testeaza *  fprintf (stderr, "can’t open 7*s", *argv); else { cat(fp); fclose(fp); }  * afiseaza, inchide *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * 1= 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * 1= 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum) ; din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s);  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii void exit(int status) ; *stdlib h*  termina normal executia prog - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 7 Fisiere 8 Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie un numar de octeti, neinterpretati (in format ): size t freadCvoid *ptr, size t size, size t nmenib, FiLE *stream); size t fwrite(void *ptr, size t size, size t nmemb, FiLE *stream);  * citesc scriu nmemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror Cu ele, putem sa ne scriem functii proprii pentru fiecare tip de date: size t readintfint *pn, FiLE *stream)  * in format binar *  { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *  { return fwrite(&x, sizeof(double), 1, stream); } fprintf (fp, "7"d", n); scrie intregul ca sir de cifre zecimale cu fwrite se scrie intregul in format binar (sizeof (int) octeti Utilizarea si programarea calculatoarelor Curs 9 Marius Minea #include #include #define MAX 512  * copiem cate un sector odata *  int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;  * nr octeti cititi *  while (ifeof(fi)) { size = fread(buf, 1, MAX, fi);  * citeste MAX octeti *  fwrite(buf, 1, size, fo);  * scrie doar cati s-au citit *  if (ferror(fi) ii ferror(fo)) return errno; return 0; Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 9 void main(int arge, char *argv[]) FiLE *fi, *fo; if (arge != 3) { fprintf(stderr, "usage: сору source destination n"); exit(l); }• else { if (!(fi = fopen(argv[l], "r"))) { fprintf(stderr, "%s: can’t open 7*s: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (i(fo = fopen(argv , "w"))) { fprintf(stderr, "%s: can’t open %s: ", argv , argv ); perror(NULL); exit(errno); } if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) i fclose(fo)) perror("Eroare la inchidere"); i Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 10 Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long fteii(FiLE "stream);  * pozitia de la inceputul fisierului *  int fseekCFiLE "stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: SEEK SET (inceput), SEEK CUR (punctul curent), SEEK END (sfarsit) void rewindCFlLE "stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflushCFiLE "stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 11 Fisiere 12 Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, feend, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf(s, "%d", &n);  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu %n) *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie Sinclude sau Sinclude "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) Sdefine LEN 20  * preprocesorul inlocuieste LEN cu 20 peste tot *  int tabCLEN];  * programul trebuie modificat intr-un singur loc *  for (i=0; i (В) ? (A) : (B)) Sdefine swapintfa, b) { int tmp; tmp = a; a = b; b = tmp; } fara interpretare => pot aparea probleme - folositi paranteze in Jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Utilizarea si programarea calculatoarelor Curs 9 Marius Minea 26 noiembrie 2012 Е о sa folosim о int sum;—for (i=0;—i++ programul incepe calculul cu o valoare a[i];    si initial? 1Т 1Т cu unei variabile (sau cu alt pointer initializat deja) cu o adresa de memorie (vom discuta ulterior) : int *p;—*p = 0; : char *p;—scanf ("° os", p) ; p este (eventual nul, daca e variabila globala) valoarea e scrisa la o , terminare fortata ATENtiE: un pointer nu este un intreg Gresit: int *p   640; i adresa unei variabile (unde e pusa in memorie) se determina la incarcarea programului   cand se aloca memoria e un in C declararea unui tablou aloca un bloc de memorie pt elemente tabloului e blocului de mem (a primului element) Daca declaram tip a[LEN] , *pa; putem atribui pa = a; &a e echivalent cu a iar a e echivalent cu *a Diferenta: adresa a e o (tabloul e alocat la o adresa fixa) a = adresa, dar putem atribui pa = adresa Ca parametri la functii, cele doua scrieri inseamna size t strlen(char s []); sau size t strlen(char *s) ; Ca declaratii, de tablou   pointer, i : char s [] = "test"; s e ’t’, s e ’ 0’ etc s e (tip char *), nu variabila cu loc in memorie NU se poate atribui s = dar se poate atribui s = ’f ’ sizeof (s) e5 * sizeof (char) &s e chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) : char *p = "test"; p e ’t’, p e ’ 0’ (la fel) p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f ’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; si apoi p = ’f ’ sizeof (p) e sizeof (char *) &p NU ep GREsiT: scanf ("° 04s" , fcp); CORECT: scanf ("704s" , p); O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + le adresa de dupa locul alocat lui v (adresa cu sizeof (tip) mai mare decat &v) 1 de pointer cu intreg: ca adresa unui element de tablou ++a, a++: a devine a + 1 inainte   dupa evaluare char *endptr(char *s) {    ret pointer la sfarsitul lui s char *p = s;    sau: char *p; p = s; while (*p) p++;    adica la pozitia marcata cu ’ 0’ return p; 2 : doar intre doi pointeri de tip tip *p, *q; = numarul intreg de obiecte de tip care incap intre cele 2 adrese Pentru numarul de octeti: se convertesc pointerii la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite alte operatii aritmetice pentru pointeri i Se pot efectua operatii logice de comparatie (==, ! = , o functie cu tablou are nevoie de toate dimensiunile in afara de prima => trebuie declarata tip-fi Ctip-t t [] [DiM2]); char t ={"ian", ,"dec"}; char *p ={"ian", ,"dec" p e un tablou de pointeri 0x460 > i a n  0 0x5C4 f e b  0 0x9FC d e c  0 p ocupa 12*sizeof(char *) octeti t = e GREsiT (t e adresa constanta a liniei 7) (+ 12*4 octeti pt constantele sir) p = "iulie" modifica o adresa (elementul 7 din tabloul de adrese p) Linia de comanda contine urmat de eventuale (parametri): optiuni, nume de fisiere Exemple: gcc -Wall -o prog prog c is director cp fisierl fisier2 in C, accesam linia de comanda declarand main cu 2 parametri: int argc nr cuvinte din linia de comanda (nr argumente + 1) char *argv[] tablou, adresele argumentelor (siruri de caractere) #include int main(int argc, char *argv[]) { printf("Numele programului: 70s n", argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element NULL (argv[argcj) Variante de printf scanf cu sursa destinatie si siruri de char int sprintf(char *s, const char *format, int sscanf(const char *s, const char *format, sprintf nu are limitare poate depasi marimea tabloului Folositi int snprintf(char *str, size t size, const char *format, in care scrierea e limitata la size caractere varianta sigura int n; char *s, *end; if (sscanf (s, "70d", &n) == 1) (citire corecta) (folosim cand nu trebuie prelucrat restul sirului dupa numar) strtol: atribuie adresa primului caracter ramas, putem prelucra restul char *end; n = strtol(s, &end, 10); (in baza 10, sau in alta baza) n = atoi(s); (returneaza 0 la eroare, dar si la sirul "0") (cu functii din ) permite sa obtinem la programului memorie de dimensiunea dorita void *malloc(size t size); aloca size octeti void *calloc(size t n, size t size); n*size octeti init cu 0 Returneaza adresa blocului de memorie alocata sau NULL la eroare (mem insuficienta) unei zone alocate cu malloc calloc: void *realloc(void *ptr, size t size); modifica marimea la size Poate muta continutul existent si returna alta adresa decat ptr if (pl = realloc(p, size)) { p = pl;  * apoi folosim p *  } Memoria alocata dinamic cand nu mai e necesara void free(void *ptr); elibereaza memoria alocata cu c malloc e necesara cand stim dinainte de cata memorie e nevoie , cand nu stim de la compilare cata memorie e necesara (tablouri cu dimensiuni aflate la rulare, liste, arbori, etc ) , cand trebuie sa returnam un obiect nou creat dintr-o functie (NU putem returna adresa var locale, memoria dispare la revenire!) char *strdup(const char *s) {    creeaza copie a lui s char *d = malloc(strlen(s) +1);    loc pentru sir si ’ 0’ return d ? strcpy(d, s) : NULL;    fa copia, returneaza d , cand trebuie pastrat un obiect citit intr-un loc temporar char *tab , buf ; int i = 0; while (i Sinclude Sdefine BLOCK 16 char *getline(void) { char *p, *s = NULL;    s initializat pentru realloc int c, lim = -1, size =0;    pastram un loc pentru  0 while ((c = getcharO) != EOF) { if (size >= lim)    s-a umplut zona alocata if (!(p = realloc(s, (lim+=BLOCK)+l))) {    mai aloca 16 ungetc(c, stdin); break;    termina daca nu mai e loc } else s = p;    tine minte noua adresa alocata s[size++] = c;    adauga ultimul caracter if (c == ’ n’) break;    iese la linie noua }    termina cu  0, realoca doar cat e nevoie if (s) { s[size++] = ’ 0’; s = realloc(s, size); } return s; , => calcule cu valori , nu doar constante Uneori dorim sa variem apelata intr-un punct de program Exemplu: parcurgerea unui tablou pentru diverse prelucrari: for (int i = 0; i 0) are argumente void *, compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *) ;   tip ptr fct int intcmp(int *pl, int *p2) { return *pl - *p2; } int tab = { -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sortat crescator Programarea calculatoarelor Curs 9 28 aprilie 2009 Marius Minea Pointeri Alocare dinamica 2 O variabila x de tipul tip are o &x de tipul Variabila x ocupa sizeof(x) (sau: sizeof (tip )) octeti pornind de la &x Adresele sunt nenule Valoarea null (adresa 0) indica o adresa invalida, in tip t ; numele t e tabloului (elem ) si are tipul Functiile au ca parametri nu continutul tabloului, ci tabloului, void f (tip t ); e la fel ca void f(tip t □) si ca void f(tip *t); Functia care primeste adresa unei variabile o poate (si citi) Ex: scanf (atribuie valori citite de la intrare), functii cu tablouri (modifica tabloului, dar nu , transmisa prin !) O "sir" are tipul Valoarea constantei "sir" este de memorie unde se afla sirul Nu putem compara un char (’a’) cu un sir (adresa) "a" ! Comparam siruri cu str(n)cmp, nu cu == (compara adrese, nu continut) : au tip, valoare, locin memorie, adresa, pot fi declarati, atribuiti, tipariti, dati parametri, au operatii specifice Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 3 Pointer = o variabila care contine adresa altei variabile tip *nume var;    nume var e pointer la o valoare de tip operator prefix - operand: o variabila (ex x); rezultat: variabilei &x - folosit doar pt variabile (si elem tablou), nu constante, expresii, etc - se poate atribui unui pointer la acel tip: int x; int *p; p = &x; operator prefix - operand: pointer; rezultat: (variabila) indicat de pointer - *p e un , poate fi folosit la stanga unei atribuiri, ca si variabilele sau elem tablou; (orice poate fi la dreapta lui =) - daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, y, *p; p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) &*p e p (p: pointer cu valoare valida): adresa obiectului de la adresa p Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 4 Putem citi tip * p; tip * p; p are tipul tip * tip *p; *p e un caracter char **s;    adresa de adr de char char *t ;    tab de 8 adr de char CU Variabila int x = 5; int *p=&x; int **pp=&p; Adresa 0x408 0x51C 0x9D0 NU este o int t = { 3, 5 }; initializeaza t NU are sens: t = { 3, 5 }; int x, *p = &x; este int x; int *p = &x; sau int x; int *p; p = &x; (e initializat atribuit p, NU *p) *p = &x e incorect ca tip! char *p = "sir"; e char *p; p = "sir"; dar *p = "sir;" e gresit! * si & au mai ridicata decat operatorii aritmetici: у = *px + 1;    cu 1 mai mult decat valoarea indicata de px *  dar *px++ da valoarea indicata de px, si incrementeaza pointerul px (nu valoarea), pentru ca ++ si * se evalueaza de la dreapta la stanga ! Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 5 Folosirea e o in program ! { int sum; for (i=0; i++ in cel mai bun caz, o comportare aleatoare - cu unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie (vom discuta ulterior) : tip *p; *p = ceva; : char *p; scanf ("° os", p) ; - p este (eventual nul, daca e variabila globala) => valoarea va fi scrisa la o (evtl nula) => memorie corupta, vulnerabilitati de securitate, rulare abandonata ATENtiE: un pointer nu este un intreg Gresit: int *p = 640; ! Doar compilatorul sistemul de operare poate alege adresele, nu noi! Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 6 Avand adresa p a unei variabile ii putem : *p = functia care primeste adresa unei variabile poate modifica valoarea ei ex scanf primete , completeaza cu valorile citite dar parametrii sunt transmisi : adresa nu se modifica void swap (int *pa, int *pb) {    schimba valorile de la 2 adrese int tmp;    variabila temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    trei atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim: - cand limbajul ne obliga (tablouri ca parametri la functii) - pentru a intoarce mai multe rezultate (functia permite doar unul) ex minimul maximul unui tablou; rezultat cod de eroare Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 7 in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare - declararea unui tablou aloca un bloc de memorie pt elementele sale - numele tabloului e adresa blocului respectiv (= a primului element) declarand tip a[LEN], *pa; putem atribui pa = a; &a e echivalent cu a iar a e echivalent cu *a Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu are o adresa &pa memorie si Pxa 5C0 5E0 Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 8 in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s []) ; sau size t strlen(char *s) ; la diferente! char s [] = "test"; s e ’t’, s e ’ 0’ etc s e o de tip char *, nu variabila cu loc in memorie NU se poate atribui s = , se poate atribui s = ’f’ sizeof(s) e 5 * sizeof (char) &s e chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) char *p = "test"; la fel: p e ’t’, p e ’ 0’ etc p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f ’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; si apoi p = ’f’ sizeof (p) e sizeof (char *) &p NU e p => e GREsiT: scanf ("° 04s" , &p); CORECT: scanf ("° 04s" , p); Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 9 O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou char *endptr(char *s) char *p = s; while (*p) p++; return p; {  * returneaza pointer la sfarsitul lui s *   * sau: char *p; p = s; *   * adica la pozitia marcata cu ’ 0’ *  2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , la parcurgere, in loc sa avansam indicele, incrementam pointerul char *strchr i(const char *s, int c) {    cauta caracter in sir for (int i = 0; s [i] ; ++i)    parcurge s cu indice i pana la ’ 0’ if (s[i] == c) return &s [i] ;    s-a gasit: returneaza adreasa return NULL;    nu s-a gasit: returneaza NULL (adresa invalida) char *strchr p(const char *s, int c) { for ( ;*s; ++s)    folosim chiar if (*s == c) return s;    s return NULL;    nu s-a gasit    scrisa folosind pointer parametrul pentru parcurgere indica caracterul curent Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 11 Fie un tablou bidimensional (matrice) declarat tip a[DlMl] [DiM2]; a[i] e adresa (constanta tip *) a unui tablou (linii) de DiM2 elemente a[i] [j] e al j-lea element din tabloul de DiM2 elemente a[i] ; adresa &a[i] [j] == a[i]+j e cu DlM2*i+j elemente dupa adresa tabloului a => o functie cu parametri tablou trebuie sa cunoasca toate dimensiunile in afara de prima => trebuie declarata tip-f i(tip-t t[] [DiM2]); char t ={"ian", ,"dec"}; t e un tablou 2-D de caractere i a n  o f e b  o • • • d e c  o si char *p ={"ian", ,"dec"}; P e un tablou de pointeri P ocupa 12*sizeof(char *) octeti (+ 12*4 octeti pt constantele sir) p ="iulie" modifica o adresa (elementul 7 din tabloul de adrese p) t ocupa 12 * 4 octeti t = e GREsiT (t e adresa constanta a liniei 7) Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 12 Pe linia de comanda, dupa numele programului rulat, pot urma argumente (parametri): optiuni, nume de fisiere Exemple: gcc -Wall -o prog prog c is director cp fisierl fisier2 in C, avem acces la linia de comanda declarand main cu 2 parametri: int argc : nr de cuvinte din linia de comanda (nr argumente + 1) char *argv[] : tablou cu adresele argumentelor (siruri de caractere) #include int main(int argc, char *argv[]) { printf ("Numele programului: ° os n" , argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element null (argv[argc]) Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 13 Folosim pentru a lucra de fapt cu indicate prin adresa declarand un pointer tip *p avem loc doar pentru o NU si pentru un (variabila) de tip Declararea lui char *s; NU inseama si loc pentru a citi memora un sir! Pana acum am indicat prin pointeri doar variabile deja declarate: int x; int *p; p = &x; char a ; char *s; s = a+5;    s = &a ; Am declarat static doar tablouri de dimensiuni cunoscute si fixe (in C99 se permit dimensiuni variabile, evaluate la rulare) Nu putem dintr-o functie un tablou: el trebuie declarat in afara functiei, si adresa transmisa la functie care il completeaza (ex scanf, strcpy, functiile scrise pentru lucrul cu vectori matrici) Functiile de (stdlib h) permit sa creem variabile noi de dimensiuni necesare aparute la rularea programului Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 14 void *malloc(size t size); aloca size octeti void *calloc(size t num, size t size); num*size octeti init CU 0 - returneaza adresa de inceput unde a fost alocat nr dat de octeti sau null la eroare (ex mem insuficienta) => unei zone alocate cu c maiioc: void *reaiioc(void *ptr, size t size); modifica marimea la size - poate returna alta adresa decat ptr, atunci muta continutul existent => Ex if (pl = realloc(p, size)) { p = pl;  * apoi folosim p *  } Memoria alocata dinamic cand nu mai e necesara void free(void *ptr); elibereaza memoria alocata cu c maiioc int i, n, *t; printf ("Nr de elemente ?") ; scanf ("° od", &n) ; if ((t = malloc(n * sizeof(int))) != NULL) for (i = 0; i #include #define BLOCK 16 char *getline(void) { char *p, *s = NULL;    s initializat pentru realloc int c, lim = -1, size =0;    pastram un loc pentru  0 while ((c = getcharO) != EOF) { if (size >= lim)    s-a umplut zona alocata if (!(p = realloc(s, (lim+=BLOCK)+l))) {    mai aloca 16 ungetc(c, stdin); break;    termina daca nu mai e loc } else s = p;    tine minte noua adresa alocata s[size++] = c;    adauga ultimul caracter if (c == ’ n’) break;    iese la linie noua }    termina cu  0, realoca doar cat e nevoie if (s) { s[size++] = ’ 0’; s = realloc(s, size); } return s; Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 16 e necesara cand stim dinainte de cata memorie e nevoie NU: int *px; px = malloc(sizeof(int)); scanf ("° od", px) ; Mai Simplu: int x; scanf ("° od", &x) ; , cand nu stim de la compilare cata memorie e necesara (tablouri cu dimensiuni aflate la rulare, liste, arbori, etc ) , cand trebuie sa returnam un obiect nou creat dintr-o functie (NU putem returna adresa de var locala, memoria dispare la revenire!) char *strdup(const char *s) { char *d = malloc(strlen(s) + 1) ; return d ? strcpy(d, s) : NULL;    creeaza copie a lui s    loc pentru sir si ’ 0’    fa copia, returneaza d , cand trebuie pastrat un char *tab , buf ; obiect citit intr-un loc temporar while (i uneori dorim sa variem apelata intr-un punct de program Exemplu: parcurgerea unui tablou pentru diverse prelucrari for (int i = 0; i se poate, folosind variabile unei functii reprezinta chiar functiei : de : tiprez Ctipl, , tipn); de (de acelasi tip): tip rez Ctipl, , tipn); se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Exemplu: int fct(void); declara o ce returneaza un intreg int (*f ct) (void); declara un ce returneaza intreg int *fct(void); e o functie ce returneaza Sintaxa pointerilor de functii e complicata => e util sa declaram un tip: typedef void (*funptr)(void);    tip pointer la functie void funptr funtab ;    tablou de pointeri de functie void Programarea calculatoarelor Curs 9 Marius Minea Pointeri Alocare dinamica 18 void mul3(int *p) { *p *= 3; } void tip(int *p) { printf ("° od ", *p); } void prel(int tab[], int len, void (*fp)(int *p)) { for (int i = 0; i 0) => foloseste argumente void * fiind compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *);  tip ptr fct cmp int intcmp(int *pl, int *p2) { return *pl - *p2; }  fct cmp intregi int tab = { -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sorteaza crescator Programarea calculatoarelor Curs 9 Marius Minea 30 noiembrie 2004 Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 2 in limbajul C, orice variabila are o : o valoare numerica; indica locul din memorie unde e memorata valoarea variabilei da adresa operandului: &x e adresa variabilei x Operandul: orice poate folosit pe partea stanga a unei atribuiri (variabila, element de tablou, functie; NU pentru expresii oarecare) O adresa poate fi tiparita (in hexazecimal) cu formatul ° op in printf #include double d; int a ;  * variabile globale *  int main(void) int k;  * variabila locala *  printf ("Adresa lui d: ° op n", &d) ;  * de ex 0x80496c0 *  printf ("Adresa lui a : ° op n", &a );  * 0x80496e0 *  printf ("Adresa lui a : ° op n" , &a );  * 0x80496f4 *  printf ("Adresa lui k: ° op n" , &k) ;  * 0xbffff8e4 *  }  * Obs &a - &a == 5 * sizeof(int) (pozitii consecutive) *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 3 Orice expresie in C are un tip => la fel si expresiile adresa : Daca variabila x are tipul tip, &x are tipul tip * int x; => &x are tipul int *, adica pointer la int (adresa de int) char c; => &c are tipul char *, (pointer la char, adresa de char) => exista tipuri de adresa diferite pentru fiecare tip de date => putem variabile de aceste tipuri (pointeri): tip * nume var; nume var e pointer la (adresa pt ) o valoare de tip = o variabila care contine adresa altei variabile da obiectul *p de la adresa data de operandul p Operand: pointer Rezultat: referinta la obiectul indicat de pointer => operator de indirectare (dereferentiere, referire indirecta prin adresa) Daca pointerul p are tipul tip *, *p are tipul tip Sintaxa declaratiei (aceeasi dar citita in doua feluri) sugereaza folosirea: char* p; p e o variabila de tipul char * (adresa de char) char *p; *p (obiectul de la adresa p) are tipul char Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 4 Pointerii au adrese, ca orice variabile: pt int *p; adresa &p are tipul int ** int ** pp = &p; => pp are tipul int **, adica adresa unei adrese de int dar putem citi int* *pp sau int **pp deci *pp are tipul int * (adresa de int) si **pp are tipul int (val de la adr *pp) Variabila int **pp=&p; Valoare 0x408 0x51C Adresa 0x408 0x51C 0x9D0 5 inainte de folosire, un pointer trebuie variabile de tipul potrivit: int x, *p, , de ex cu adresa unei **pp; p = &x; pp = &p; O *p poate fi folosita (in cazul de mai sus, *p se foloseste absolut la fel (sinonim) cu x) int x, y, z, *p; p=&x; z=*p;  * z = x *  *p=y;  * x = у *  : Operatorii adresa & si de indirectare * sunt *&x este chiar x, pentru orice obiect (variabila) x &*p are valoarea p, pentru orice variabila pointer p (dar p e o variabila si poate fi atribuita; &*p e o expresie si nu poate) Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 5 Utilizarea oricarei variabile neinitializate e o eroare logica in program ! { int x; printf ("° od", x) ; }  * cat e x ?? valoare la intamplare! *  , ca orice variabile ! - cu adresa unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie alocata dinamic (vom discuta ulterior) : tip *p; *p = valoare; p este !! (eventual nul) => valoarea va fi scrisa la o adresa de memorie necunoscuta (evtl nula) => coruperea memoriei, rezultare eronate sau imprevizibile, terminarea fortata a programului (sub sisteme de operare cu memorie protejata) definit in stddef h ca (void *)o: nu e o adresa valida => folosit (la initializari, sau returnat) ca valoare de pointer invalid : pointerii au valori numerice, dar nu sunt acelasi lucru ca intregii => Nu convertiti intre pointer si int (e dependent de implementare) : Un prim test al corectitudinii programului: Verificati ca expresiile au tipuri corespunzatoare (ex la atribuire) => valabil si pentru pointeri (nu confundati p cu *p, etc ) Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri б Permit prin transmiterea adresei ei - o variabila se poate modifica prin indirectarea unui pointer catre ea - nu se modifica adresa (transmisa tot prin valoare) ci continutul ei void swap (int *pa, int *pb)  * schimba val de la adr pa si pb *  int tmp;  * variabila auxiliara necesara pentru interschimbare *  tmp = *pa; *pa = *pb; *pb = tmp;  * trei atribuiri de intregi *  }  * in functie s-a lucrat cu continutul de la adresele pa si pb *  Ex : int x = 3, у = 5; swap(&x, &y);  * acum x = 5 si у = 3 *  : Nu se poate obtine efectul cu void swapdnt m, int n); (ar schimba valorile transmise in corpul functiei, fara efect in afara) Folosire: cand limbajul nu permite transmiterea prin valoare ( ) sau ar fi ineficienta (structuri mari) => transmitem adresa variabilei Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 7 in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare Declararea unui tablou aloca un bloc de memorie pt elementele sale => blocului respectiv (= a primului element) => pentru tabloul tip a[LEN]; numele a e o de tipul tip * &a e echivalent cu a (adresa tabloului e adresa primului element) a e echivalent cu *a (obiectul de la adresa a e primul element) Daca declaram tip *pa; putem atribui pa = a; Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu de memorie si are o adresa &pa adresa Pa 5C0 int a ; 5E0 int *pa = a; Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 8 in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s []) ; sau size t strlen(char *s) ; (de fapt, compilatorul converteste prima varianta in a doua) size t: tip pt dimensiuni pozitive din stddef h (ca si unsigned sauunsigned long) => nu se transmit tablouri (bloc de memorie) la functii, ci adresele lor Fie char t ; Compilatorul considera &t ca fiind t => s-ar putea scrie si scanf ("° 020s", &t) in loc de scanf ("° 020s", t) se recomanda totusi prima varianta, pentru uniformitate cu cazul: char *p; p = s; scanf ("° 020s", p)  * aici e incorect &p ! *  Diferenta intre tablouri si pointeri: sizeof t == 21*(sizeof char) diferit de sizeof p == sizeof(char *) Atentie! Verificati corespondenta tipurilor in expresii Ex char m ; char *p; p si m nu au acelasi tip, dar p si m au ! Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 9 O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou a + i e echivalent cu &a[i] iar *(a + i) e echivalent cu a[i] char *endptr(char char *p = s;  * while (*p) p++; return p; *s) {  * returneaza pointer la sfarsitul lui s *  sau: char *p; p = s; *   * adica la pozitia marcata cu ’ 0’ *  2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , 0 pt sl>s2, 0 pt egal *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 11 char *strncpy(char *dest, const char *src, size t n) { char *p = dest;  * copiaza cel mult n caractere *  while (n— && *p++ = *src++); return dest; int strncmp (const char *sl, const char *s2, size t n) { if (n == 0) return 0;  * compara pe lungime cel mult n *  while (—n && *sl == *s2 && *sl) { sl++; s2++; } return *sl - *s2;  * 0 pt sl>s2, 0 pt egal *  char *strchr(const char *s, int c) {  * cauta primul c in s *  do if (*s == c) return s; while (*s++); return NULL;  * daca nu a fost gasit *  void *memset(void *s, int c, size t n);  * seteaza n octeti cu c *  void *memcpy(void *dest, const void *src, size t n); void *memmove(void *dest, const void *src, size t n);  * copiaza n octeti; ultima varianta si pentru zone suprapuse *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 12 Fie declaratia tip a[D!Ml] [DiM2]; Elementul a[i] [j] este al j-lea element din tabloul de DiM2 elemente a[i] si are adresa &a[i] [j] == (tip *)(a + i) + j == (tip *)a + DiM2*i + j => pentru compilarea expresiei a[i] [j] e necesara cunoasterea lui DiM2 => in declaratia unei functii cu parametri tablou trebuie precizate toate dimensiunile in afara de prima (irelevanta): void f(int m[] ); Declaratiile char s[] = "sir"; si char *s = "sir"; sunt diferite! - prima rezerva spatiu doar pt sirul "sir", iar adresa s e o constanta - a doua rezerva spatiu si pentru pointerul s, care poate fi reatribuit char s ={"ian", ,"dec"}; si char *s ={"ian", ,"dec"}; primul e un tablou 2-D de caractere, al doilea e un tablou de pointeri Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 13 Limbajul C permite accesul la parametrii argumentele) cu care programul e rulat din linia de comanda (ex optiuni, nume de fisiere) De asemenea, permite returnarea de program a unui cod intreg (folosit uzual pentru a semnala succes sau o conditie de eroare) #include int main(int argc, char *argv[]) { int i; printf ("Numele programului: ° os n" , argv ); if (argc == 1) printf("Program apelat fara parametri n"); else for (i = 1; i = 1 - argv[l], etc : parametrii, asa cum au fost separati de spatii Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 14 Adresa unei functii se poate obtine, memora, si utiliza pentru a o apela, pentru o functie tip rez fct (tipl, , tipn); adresa are tipul tip rez (*pfct) (tipl, , tipn); se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Atentie la sintaxa: int *fct(void); declara o functie ce returneaza pointer la intreg int (*f ct) (void); declara un pointer la o functie ce returneaza intreg Exemplu de utilizare: parametrizarea unei alte functii Algoritmul quicksort, declarat (in stdio h) ca functie cu parametrii: - adresa tabloului de sortat, numarul si dimensiunea elementelor - adresa functiei care compara 2 elemente (returneaza 0) efectuarea compararii depinde de tip: intreg, sir, definit de utilizator void qsort(void *base, size t num, size t size, int (*compar) (void *, void *)); - foloseste argumente void * fiind compatibile cu pointeri la orice tip Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 15 - pentru tabele de rutine, apelate in functie de un indice - exemplu: meniu cu apelare de functii in functie de tasta apasata void help(void); void menu(void);  * *  void quit(void); void (*funtab) (void) = { help, menu, quit void do cind(void) int к = getchar() - ’ 0’; if (k >= 0 && к e util sa declaram un tip: typedef void (*funptr)(void);  * pointer la functie void *  funptr funtab ;  * tabloul de pointeri de functie *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pointeri 16 Pana acum am atribuit la pointeri doar adrese de variabile existente si am declarat static doar variabile de dimensiuni cunoscute la compilare Discutam: functii de gestiune dinamica a memoriei (stdlib h): alocarea memoriei dupa necesitati stabilite la rularea programului void *malloc(size t size);  * aloca size octeti *  void *calloc(size t num, size t size);  * num*size oct init 0 *   * m calloc returneaza NULL la eroare (ex mem insuficienta) *  void *realloc(void *ptr, size t size);  * modifica dimensiunea, poate muta blocul, dar pastreaza continutul memoriei *  void free(void *ptr);  * elibereaza mem alocata cu c malloc *  int i, n, *t; printf ("Nr de elemente ?") ; scanf ("° od", &n) ; if ((t = malloc(n * sizeof(int)) != NULL) for (i = 0; i #include #define NUM 100  * alocam pt 100 de numere odata *  typedef int (*cmpptr)(const void *, const void *) ; int cmp(int *p, int *q) { return *p - *q; }  * pt sortare *  void main(void) { int i=0, n=0, *t= NULL;  * contor, total, tablou *  do {  * aloca cate NUM intregi, initial si cand e nevoie *  if (i == n) { n += NUM; t = realloc(t, n*sizeof(int)); } scanf ("7od", &t [i]) ;  * realloc(NULL, sz) e ca si malloc(sz) *  } while (t [i++]); qsort(t, i, sizeof(int), (cmpptr)cmp);  * sorteaza *  for (n = 0; n metoda diferita de simulare sau testare Verificare formala Curs 9 Marius Minea Analiza fluxului de date 3 Analiza programelor e legata tot mai mult de verificarea formala Verificarea formala: stabileste ca un sistem e corect prin analiza riguroasa a unui model matematic al sistemului -in general, proprietati specifice, detaliate despre comportament (ex dupa evenimentul A apare evenimentul В etc ) - necesita in principiu analiza (simbolica) a secventelor de executie a modelului (explorarea spatiului starilor) Analiza statica: bazata tot pe tehnici matematice, riguroase - de regula pentru proprietati mai generale - folosind aproximatii sigure (conservatoare) - de regula nu exploreaza spatiul starilor programului Verificare formala Curs 9 Marius Minea Analiza fluxului de date 4 - Analiza fluxului de date principalele tehnici originare din domeniul compilatoarelor aspecte legate de dualitatea precizie   eficienta - Analiza bazata pe constrangeri cadru general pentru reprezentarea prin relatii de constrangere intre multimi, cu proceduri eficiente si generice de solutionare - interpretare abstracta simplifica programul prin definirea unei semantici care considera doar aspectele relevante pentru proprietatea dorita - Sisteme de tipuri definind sistem corespunzator de tipuri, multe proprietati pot fi convertite la probleme de inferenta   verificare a tipurilor Verificare formala Curs 9 Marius Minea Analiza fluxului de date 5 Tehnici cu originea in domeniul compilatoarelor - folosite pentru generarea de cod (alocarea de registri) - si optimizarea de cod (propagarea constantelor, factorizarea expresiilor comune, detectarea variabilelor nefolosite, etc ) Ulterior, unificateintr-un cadru general care permite aplicarea si la alte probleme de analiza de cod Abordarea de baza: - construirea grafului de flux de control al programului - urmarirea modului in care proprietatile de interes se modifica pe parcursul programului (la traversarea nodurilor   muchiilor grafului) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 6 Reprezentare in care: - nodurile sunt instructiuni - muchiile indica secventierea instructiunilor (inclusiv salturi) => putem avea: noduri cu: - un singur succesor (ex atribuiri), - mai multi succesori (instructiuni de ramificatie) - mai multi predecesori (reunirea dupa ramificatie) Obs : Alternativ, dar mai putin folosit: - nodurile sunt puncte din program (valori pentru PC) - muchiile sunt instructiuni cu efectele lor Verificare formala Curs 9 Marius Minea Analiza fluxului de date 7 G = (N,E) : graful de flux de control (7V : noduri; E : muchii) s : o instructiune de program (nod in graful de flux de control) entry, exit : punctele de intrare si de iesire din program in(s') : multimea muchiilor care au s ca destinatie out(s) : multimea muchiilor care au s ca sursa src(e), c est(e) : instructiunea sursa si destinatie a muchiei e pred(s) : multimea predecesorilor instructiunii s succ(s) : multimea predecesorilor instructiunii s Cu aceste notiuni scriem ce descriu cum se modifica valorile analizate (dataflow facts) de la o instructiune la alta Notam cu indicii jn si out valoarea analizata la intrarea si respectiv iesirea din instructiunea s Verificare formala Curs 9 Marius Minea Analiza fluxului de date 8 Care sunt toate atribuirile (definitiile) care pot atinge punctul curent (inainte ca valorile atribuite sa fie suprascrise) ? Elementele de interes sunt perechi: (variabila, linie de definitie) Pentru fiecare instructiune (identificata cu eticheta ei Z) ne intereseaza valoarea dinainte RDj^s) si de dupa RDou^s) - nodul initial din graf nu e atins de nici o definitie: RDout(entry) = {(>,?) | v e V} - o atribuire l : v sensul analizei e inapoi Operatia de combinare (meet): LV eout^s) = 0 Us'(=SL CC(s) bV efn(s') daca succes) = 0 altfel => combinarea facuta prin uniune (may, pe cel putin o cale) Calculul: algoritm de tip worklist care face modificari pornind de la valorile initiale pana nu mai apar schimbari => se atinge un Verificare formala Curs 9 Marius Minea Analiza fluxului de date 10 in fiecare punct de program, care sunt expresiile a caror valoare a fost calculata anterior, fara sa se modificat, pe toate caile spre acel punct? (daca valoarea se tine minte intr-un registru, nu trebuie recalculata) Functia de transfer: A ?out(s) = (A ? n(s)   {e | V(e) П write(s) 0}) U{e G Subexp{s) | V(e) П write(s) = 0} (expresiile de la intrarea in s care nu au variabile modificate de s, si orice expresii calculate in s fara a li se modifica variabilele) Operatia de combinare (meet): daca precis) = 0 altfel => combinarea e facuta prin intersectie {must, pe toate caile); analiza e inainte Verificare formala Curs 9 Marius Minea Analiza fluxului de date 11 Care sunt expresiile care trebuie evaluate pe orice cale din punctul curent inainte ca valoarea vreunei variabile din ele sa se modifice ? => evaluarea se poate muta in punctul curent, inainte de ramificatii - o analiza inapoi, si de tip universal {must) VBEin{s) = (VBEout(s)   {e | V(e) П write(s) ф 0}) U Subexp{s) VBEout(s) — 0 daca succ(s) = 0 As'esucc(s) VBEin(s') altfel Verificare formala Curs 9 Marius Minea Analiza fluxului de date 12 : analizam diverse proprietati, de ex - valoarea unei variabile intr-un punct de program - sau intervalul de valori pentru o variabila - sau multimi de variabile (live), expresii (available, very busy), definitii posibile pentru o valoare (reaching definitions), etc : o multime D de valori pentru o proprietate (dataflow facts) Restrictie: D e o multime Verificare formala Curs 9 Marius Minea Analiza fluxului de date 13 - am asociat cu punctele de program multimi de valori pentru proprietatea analizata - am recalculat iterativ multimile respective, prin operatii de reuniune sau intersectie; obtinand tot mai multe (sau mai putine) valori Care sunt premisele esentiale pentru a efectua calculele in acest fel ? (L, □) e o multime echipata cu o ЕС L x L, adica o relatie: - reflexiva, x □ x pentru orice x e L - tranzitiva, xtyhyLz^xtz, pentru orice x,y,z e L - antisimetrica: x ^y  y ^x^x = y, pentru orice ж, у e L Exemplu: multimea partilor (P(D),C) sau (P(Z?),D) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 14 Latice (completa) = o multime partial ordonata in care orice submultime finita are un cel mai mic majorant (least upper bound) si cel mai mare minorant (greatest upper bound) iq e majorant al lui Y C L daca VZ e Y avem l □ iq iq e minorant al lui Y C L daca VZ e Y avem iq □ Z Notam: [JY: cel mai mic majorant al multimii Пк: cel mai mare minorant al multimii Y C L si± = U0 = riL Т=П0 = иГ Definim atunci operatiile meet : хПу = П{ж,і } Join : x U у = | |{ж, у} (in cazul multimii partilor: intersectie, reuniune) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 15 Operatiile n (meet} si и (join} au proprietatile: — sunt comutative - sunt asociative - ж П ± = ± si x u T = T, pentru orice x Latice distributiva: in care operatorii n si и sunt reciproc distributivi: x П (y U z} = (x П y} U (x П z} x U (у П z} = (x U у} П (x U z} Verificare formala Curs 9 Marius Minea Analiza fluxului de date 16 instructiunile determina modificari ale starii programului Valoarea unei variabile dupa o instructiune e o functie a valorii de la inceputul instructiunii : Fiecare instructiune s are asociata o functie de transfer F(s) : L L care determina modul in care valoarea proprietatii la inceputul instructiunii e modificata de instructiune: Propout(s) = F(s)(ProPin(s^ (Pentru analize inainte), sau invers (pentru analize inapoi) Restrictie: punem conditia ca functiile de transfer sa fie monotone:   E у => f O) C f (y) (daca stim mai multe despre argument, atunci si despre rezultat) Caz particular: bitvector frameworks: laticea e o multime de parti P(B), functii de transfer monotone si de forma: F(s)(t>) = (v   kill(s)) U gen(s) (v = dataflow fact, gen killts) = informatia generata eliminata in s) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 17 Exemplu: pentru analize inainte: Pr°Poi t(s) = i?(s)(-ProP n(s)) Propin(s) = ns,eprec (s) Propout(s') unde prin П am reprezentat efectul combinarii informatiilor (meet) pe mai multe cai (ar putea fi n sau u) initial, e cunoscuta valoarea Propout(entry) Pentru analize inapoi, se schimba rolul intre in si out, si e cunoscuta valoarea lui Propin(exity) Verificare formala Curs 9 Marius Minea Analiza fluxului de date 18 Pentru calculul solutiei la sistemul de ecuatii de mai sus: algoritmi iterativ care propaga modificarile in sensul analizei foreach s e N do Propus) = T  * no info *  Propjn(entry') = init  * in functie de analiza *  W = {entry} while W 7^ 0 choose s & W w = VP {s} Prop n(s) = ns,eprecy(s) Propout(s') Propout(s) = ^(s)(Frop;-n(s)) if change then forall s' e succ(s) do W = W и {s'} Verificare formala Curs 9 Marius Minea Analiza fluxului de date 19 Terminarea analizei e garantata daca functia de transfer e monotona: x □ у =>  ( t) □ fty), ceea ce implica faptul ca proprietatile calculate se modifica in mod monoton Def: pentru o functie f: o valoare x pt care  ( t) = x Teorema lui Tarski garanteaza ca o functie monotona pe o latice completa are un punct fix minimal si un punct fix maximal Algoritmul worklist calculeaza punctul fix minimal dat fiind sistemul de functii de transfer Verificare formala Curs 9 Marius Minea Analiza fluxului de date 20 Dorim sa calculam efectul combinat al instructiunilor programului: pentru p = S1S2 sn sir de instructiuni definim F(p) = F(sn) o o F(s2) o F(si) si dorim sa calculam: ^pGPath(Prog) Fp(entry) Dar algoritmul iterativ combina efectele la fiecare punct de intalnire inainte de a calcula mai departe Functiile f fiind monotone, avem: f^xUy) □  (ж) U (y) deci analiza pierde din precizie Pentru functiile de transfer distributive avem chiar:  (ж) и  (у) =  (ж U у) Se demonstreaza ca in acest caz algoritmul iterativ (care genereaza o solutie de punct fix) e echivalent cu calculul solutiei prin combinarea valorilor pe toate caile posibile {meet over aii paths) => combinarea diverselor cai de executie nu pierde informatie Cele 4 exemple date (live variables, etc ) sunt distributive Verificare formala Curs 9 Marius Minea Analiza fluxului de date 21 — inainte sau inapoi — must sau may - dependente sau independente de fluxul de control (flow (in)sensitive): Trebuie luata in considerare ordinea instructiunilor in program - nu: ce variabile sunt folosite modificate, functii apelate, etc - da: proprietati legate de valorile calculate efective de program - dependente sau independente de context in cazul programelor ce contin proceduri: e specializata analiza fiecarei proceduri in functie de locul de apel, sau se poate face un sumar (o analiza comuna) ? Verificare formala Curs 9 Marius Minea Analiza fluxului de date 22 Modelarea programelor cu proceduri: in graful de flux de control, un - muchie de la locul de apel la inceputul procedurii - muchie de la sfarsitul procedurii la instructiunea de dupa apel in felul acesta, se obtin toate caile, dar si cai nefezabile => se restrange analiza asupra cailor realizabile, in care apelurile si reintoarcerile din functii sunt imperecheate corect Verificare formala Curs 9 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  21 noiembrie 2016 pentru ca orice program trebuie in logica, putem exprima proprietati in structuri de date Un dictionar contine doua valori egale? E o permutare? module M = Мар Маке(String) m = M for all ( к v -> (M exists ( k2 v2 -> k2 О к && v2 = v) m)) m m = M for all ( v -> M exists ( к -> к = v) m) m = M (singleton i > add i > add = M (singleton i > add i > add = is inj im = is perm pm Functiile for all si exists pe colectii trebuie doar sa indicam proprietatea dorita   x{boy{x)    girl(x) —> child(x))  boy(x) V -girl(x) V child(x) - -i3x(boy(x) Л good(x)) negata: (^child(y) V -getstrain(y)) Л boy(c) Л good(c) -iboy(x) V A boy(c) V В Demonstram prin Д[х н> с] V В Demonstratia е facuta а tine cont (sau intelege) predicatelor boy, child, good, etc => puteau fi P(x), Q(x)  ?(x), Demonstratia e buna pentru care satisfac ipotezele Exemplu de teorema: 0 defineste o Vx R(x, x) AVxVy( ?(x,y) —> R(y,x)) AVxVyVz( ?(x,y) A R(y, z) —>  ?(x, z)) —> VxVy(-i3z( ?(x, z) A R(y, z)) VVz( ?(x, z) O  ?(y,z))) a multimii de definitie reflexivitate simetrie tranzitivitate clase disjuncte sau clase identice Teorema e adevarata indiferent de atribuita lui R(x,y) (indiferent de ) R ar putea fi (printre altele): c ef R(x,y) = x = у mod d (acelasi rest la impartirea cu d) c ef R(x,y) = length(x) = length(y) liste siruri de aceeasi lungime Definim mai precis ce inseamna o Formulele logicii predicatelor sunt definite structural recursiv variabila v sau constanta c f(tl,       , in) cu f functie n-ara si ti,       , in termeni (well-formed formulas, formule bine formate): - - ,in) - О! O! —> (3 Vv O! tl = t2 cu P predicat n-ar; ti,       , in termeni unde a este o formula unde a,(3 sunt formule cu v variabila, а formula: cu ti, t2 termeni (in logica de ord 1 cu egalitate) Fata de logica prepozitionala, in loc de propozitii avem (peste termeni) Logica se numeste , deoarece cuantificatorii logici se pot aplica doar variabilelor Ca in logica prepozitionala (si pentru orice limbaj), deosebim = forma, regulile dupa care construim ceva (aici, formule) = intelesul constructiilor de limbaj La fel ca in logic prepozitionala, lucram cu (demonstratia): procedeu pur sintactic (consecinta semantica): interpretam formula {intelesul ei, valoarea de adevar) Ne intereseaza corespondenta dintre aceste doua aspecte Definim: putem variabila x cu termenul t in Vyy daca: x nu apare liber in ( 3 —> а) (A1-A3 din logica prepozitionala) A2: (a ( 3 7)) ((a -> V) -> (a -> 7)) АЗ: (-1 3 —> -ia) —> (a —>  3) A4: Vx(a —>  3) —> (Vxa —> Vx 3) A5: Vxa —> a[x Vxa daca x nu apare liber in a л A7- x — % in logica cu egalitate, adaugam si ' ,, A8: x = у —> a = p unde  3 se obtine din a inlocuind oricate din aparitiile lui x cu y : e suficient А A^ В В Fie H o multime de formule 0 (demonstratie) din H e un sir de formule Ді, A2,       ,An, astfel ca V  G 1, n 1 Д,- este o 2 Aj este o 3 Ai rezulta prin , sau (o formula din  7), sau din Aj,Ak anterioare (j, к U pentru orice simbol de predicat n-ar P, o submultime Pi C Un (o relatie n-ara pe U) Deci, dam o interpretare fiecarui simbol din formula 0 interpretare nuda valori variabilelor (vezi ulterior: atribuire) VxVyVz P(x у) Л P(y,z) —> P(x, z) tranzitivitate De exemplu: universul U = numere reale; predicatul P: relatia 3z P(x,z) Л P(z,y) Gasiti o interpretare in care e adevarata si una in care e falsa ? Fie   о cu univers U si fie V multimea tuturor simbolurilor de variabile 0 este o functie s : V —> U (da fiecarei o din ) => din atribuirea s se poate obtine valoarea pentru orice (stim valoarea fiecarei variabile si intelesul fiecarei functii) interpretarea   da si intelesul fiecarui => putem calcula a unei formule -i, —> etc au intelesul cunoscut din logica prepozitionala trebuie definit intelesul (semantica) lui Spunem ca   xtp e adevarata in interpretarea   cu atribuirea s daca e adevarata inlocuind x cu valoare d G U din univers Un pentru o formula desc( Y, Z) Fie ca intrebare scop tinta (engl ) desc(X, vasile) 0 = o valoare pentru X care face predicatul adevarat 0 formula e daca e o Scriem negatia intrebarii: -> desc(X, vasile) adica: desc(X, vasile) e pentru orice X incercam sa derivam o contradictie cu ipotezele folosind Alegem pentru unificare prima regula (redenumind cu variabile noi): desc(Xl, Yl) V- fiu(Xl, Yl) Obtinem ca rezolvent -i fiu(X, vasile) X1=X, Yl=vasile Se poate unifica cu faptul nr 4 fiu (petre, vasile) Obtinem ca rezolvent clauza vida (contradictie) X=petre Deci, desc(X, vasile) pentru orice X dese (petre, vasile) e X=petre eo Gasim in continuare si alte solutii Pornim tot cu negatia intrebarii: -> Unificam cu regula 2 (redenumind din nou variabilele): V fiu(X2, Y2) V desc(Y2, Z2) Obtinem: -> fiu(X, Y2) V-i desc(Y2, vasile) X2=X, Z2=vasile Unificam cu fiu(ion, petre) (nr 1) X=ion, Y2=petre Obtinem rezolventul -i dese (petre, vasile) Am obtin ut inainte desc(petre, vasile) derivam clauza vida X=ion e inca o solutie pentru intrebarea initiala Daca intrebarea are variabile, interpretorul Prolog va genera toate solutiile posibile (toate unificarile substitutiile pentru variabile) Altfel, determina daca predicatul dat (fara variabile) e adevarat Notiunile recursive se scriu similar in logica si programare functionala Pentru liste folosim constanta nil (lista vida) si constructorul cons inversarea devine cu 3 argumente: lista, acumulator, rezultat rev3(nil, R, R) rev3(cons(H, T), Ac, R) rev3(T, cons(H, Ac), R) rev(L, R) rev3(L, nil, R) Cand lista e vida, rezultatul e acumulatorul Altfel, adaugand capul listei la acumulator, obtinem acelasi rezultat inversarea se obtine luand acumulatorul (auxiliar) lista vida Dand ca intrebare rev(c(l, c(2, c(3, n 7)))),X) obtinem X = c(3, c(2, c(l, n 7))), derivarea (rationamentul) fiind: rev(c(l, c(2, c(3, n 7))), X) rev3(c(l, c(2, c(3, nil))), nil, X) rev3(c(2, c(3, nil)), c(l, nil), X) rev3(c(3, nil), c(2, c(l, nil)), X) геѵЗІпіі c(3, c(2, c(l, nil))), X) Ll=c(l,c(2,c(3,nil))), R1=X Hl=l, Tl=c(2,c(3,nil)), Acl=nil H2=2, T2=c(3,nil), Ac2=c(l,nil) H3=3, T3=nil, Ac3=c(2,c(l,nil)) X=c(3,c(2,c(l,nil))) Prolog foloseste un caz particular de rezolutie: = clauze cu : pi hi Л Л hk (implicatie) se transforma in p; V - gi V V -*gm Pentru astfel de clauze, exista o metoda de rezolutie mai simpla: se porneste de la tinta se cauta rand fiecare scop partial gj in concluziile clauzelor si se inlocuieste cu conjunctia premiselor din clauza privit ca rezolutie: se unifica un scop -*gj cu o concluzie pi, rezulta inlocuirea cu - cu aceste reguli, se poate scrie un algoritm recursiv de unificare care determina (orice alt unificator se poate obtine din el printr-o alta substitutie) Daca unificam pe x cu у si apoi pe у cu f(z, a), atunci si x e unificat cu f(z, a) => Structura de date+algoritm pentru lucru cu clase de echivalenta Operatii: (element): gaseste reprezentantul clasei de echivalenta (eleml, elem2): declara elementele ca fiind echivalente (si raman asa mai departe) implementare: padure de cu legaturi de la fiu la parinte : returneaza radacina (chiar nodul, daca e singur) : leaga radacina unuia de radacina celuilalt 7^ Y x find(X) = find(Y) = find(Z) = Z union(Ti, T2) produce un de la variabile find(X) da (cautand recursiv) subst(D, T) face substitutiile union(Y S) leaga find(Y) si find(S) care unifica Ti cu T2 (siruri) la termeni reprezentantul lui X din dictionarul D in termenul T Logica de ordinul i nu e legata de un anumit univers, dar in matematica, folosim universul numerelor (intregi sau reali) Principiul matematice e (in ciuda numelui) o in a numerelor naturale S-ar putea formula: VP[P(0) Л V c G N P(k) -> P(k + 1)] —> Vn G N P(n) dar formula e in logica de (cuantificare peste predicate) in aritmetica lui Peano, e definit ca o (o axioma pentru fiecare predicat) => nu necesita cuantificare peste predicate Vx[P(0, x) Л ¥n(P(n, x) —> P(S(n), x)) —> VnP(n, x)] x: toate celelalte variabile de care depinde predicatul P Principiul inductiei matern : echivalent cu Orice multime nevida de nr naturale are un cel mai mic element Mai general: : demonstram proprietati despre obiecte tot mai complexe (pt obiecte definite inductiv recursiv) de incompletitudine: Orice sistem logic capabil sa exprime aritmetica elementara nu poate fi si consistent si complet i e , se poate scrie o afirmatie adevarata dar care nu poate fi demonstrata in acel sistem Demonstratie: codificand formule si demonstratii ca numere construim un numar care exprima ca formula sa e nedemonstrabila de incompletitudine: Consistenta unui sistem logic capabil sa exprime aritmetica elementara nu poate fi demonstrata in cadrul acelui sistem dar ar putea fi eventual demonstrata in alt sistem logic 28 noiembrie 2011 Un e o secventa de date (octeti) stocata pe un mediu extern Programele scrise pana acum: au citit de la intrarea standard (uzual: tastatura) au scris la iesirea standard (uzual: ecranul) Orice program de acest fel poate lucra cu fisiere, prin: redirectarea intrarii: program fis out txt redirectarea ambelor: program fis out txt 1 Deschiderea fisierului: 2 Citirea   scrierea: (f)getc, (f)putc, fgets, fputs, fscanf, fprintf 3 inchiderea fisierului: 1: : se refera la fisier prin (sir, char *) produce un pointer de tip spre o structura de date interna (fisierul e gata de lucru) 2, 3: Restul functiilor: folosesc pointerul FiLE * returnat de fopen NU se mai refera la fisier prin nume (read): deschidere pentru citire (trebuie sa existe) (write): deschidere pentru scriere (e sters daca exista) (append): deschidere pentru adaugare (pozitionare la sfarsit, datele existente raman) La write, append: fisierul e creat daca nu exista Variante: r+, w+, a+: fisierul se deschide in modul indicat, dar se poate folosi si operatia complementara (scriere   citire) Fisiere text si binare: implicit, un fisier e deschis in mod text Prelucram astfel fisiere care contin doar texte (caractere tiparibile, spatii, ’ t’ si ’ n’) : deschidere in mod binar (pentru orice alt format) FiLE *fopen (const char *pathname, const char *mode) arg 1: cu poate fi absolut sau fata de directorul curent arg 2: reprezentand incepe cu r, w, sau a optional: + si sau b fopen returneaza NULL in caz de eroare (trebuie testat ii!) Altfel, valoarea returnata (un FiLE*) e folosita mai departe int fclose(FiLE *stream) Scrie orice a ramas in tampoanele de date, inchide fisierul Returneaza 0 in caz de succes, EOF in caz de eroare in stdio h sunt definite: : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) Aceste fisiere sunt deschise automat la rularea programulu E bine ca mesajele de eroare sa fie scrise la stderr, pentru a le putea separa de scrierea la iesirea stdout Cate un int fputc(int c, FiLE *stream)    scrie caracter in fisier int fgetc(FiLE *stream)    citeste caracter din fisier    gete, pute: ca si fgetc, fputc int ungetc(int c, FiLE *stream)    pune caracter c inapoi Citire scriere int fscanf (FiLE *stream, const char *format, ) int fprintf(FiLE *stream, const char *format, ) Cate o int fputs(const char *s, FiLE *stream)    scrie un sir int puts(const char *s)    scrie sirul si apoi  n la iesire char *fgets(char *s, int size, FiLE *stream)   citeste din fisier in tabloul s, max size caract + ’ 0’ Secventa tipica de lucru cu un fisier (exemplu pentru citire) FiLE *fp; if (!(fp = fopen("nume ext", "r"))) { *trateaza eroare* } else {  * foloseste: getc putc fscanf fgets etc *  } if (fclose(fp)) {  * trateaza eroarea *  } Daca numele fisierului e dat pe linia de comanda (ex primul arg ) int main(int argc, char *argv[]) FiLE *f; if (argc != 2) { fprintf(stderr, "folosire corecta: program numefisier n"); return 1;    sau alt cod de eroare } else if (!(f = fopen(argv , "r"))) {  * trateaza eroarea, termina programul *  }    foloseste fisierul, apoi inchide } La intrarea iesirea in mod au loc dependente de implementare (ex : traducere  nin  r n pt DOS Windows) =г Fisierele care nu contin doar text trebuie deschise in mod (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea in fisier folosesc => Cititi dupa scriere: doar golind intai tampoanele (f f lush) sau repozitionand indicatorul (fseek) => Scrieti dupa citire: doar la EOF sau repozitionand indicatorul Sinclude void cat(FiLE *fi)    afiseaza un fisier deja deschis { int c; while ((c = fgetc(fi)) != EOF) putchar(c); }    afiseaza stdin sau fisierele din linia de comanda void main(int arge, char *argv[]) { FiLE *fp; if (arge == 1) cat(stdin);    fara arg, citeste de la intrare else while (—arge >0) {    pt fiecare argument pe rand if (!(fp = fopen(*++argv, "r"))) fprintf (stderr, "can’t open 70s", *argv) ; else { cat(fp); fclose(fp); } int feof(FiLE *stream) != 0: ajuns la sfarsit de fisier int ferror(FiLE *stream) != 0 daca fisierul a avut erori void exitfint status termina executia programului cu val data void clearerr(FiLE *stream) reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala int errno declarata in errno h Sau: functia char *strerror(int errnum) din string h returneaza un sir de caractere cu descrierea erorii Sau: functia void perror(const char *s) din stdio h tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Pana acum am folosit functii pentru citirea in mod text Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t nmemb, FiLE *strm) size t fwrite(void *ptr, size t size, size t nmemb, FiLE *strm) citesc scriu nmemb obiecte de cate size octeti Functiile intorc obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror Putem defini functii pentru a scrie citi numere in format binar int readint b(FiLE *stream)    intreg in format binar { int n; fread(&n, sizeof(int), 1, stream); return n; } size t writedbl(double x, FiLE *stream)    real in format binar { return fwrite(&x, sizeof(double), 1, stream); } Sinclude Sinclude Sinclude Sdefine MAX 512 int main(int arge, char *argv[]) { FiLE *fi, *fo; if (arge != 3) { fprintf(stderr, "usage: сору source dest n"); exit(-l); } else { if (!(fi=fopen(argv[l], "r"))){perror(argv[l]);exit(errno if (!(fo=fopen(argv , "w"))){perror(argv );exit(errno char buf[MAX]; int size;    nr octeti cititi while (!feof(fi)) { size = fread(buf, 1, MAX, fi); fwrite(buf, 1, size, fo);    scrie doar size octeti if (ferror(fi) || ferror(fo)) exit(errno); if (fclose(fi) | fclose(fo)) perror("Eroare la inchidere"); Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: int fseek(FiLE *stream, long offset, int whence) Parametrul 3: punctul de referinta pt pozitionarea cu offset: SEEK SET (inceput), SEEK CUR (punctul curent), SEEK END (sfarsit) void rewind(FiLE *stream) repozitioneaza indicatorul la inceput la fel ca fseek(stream, OL, SEEK SET); clearerr(stream); Repozitionarea trebuie efectuata: cand dorim sa "sarim" peste o anumita portiune din fisier cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el NU e posibila pozitionarea in orice fisier! (ex stdin stdout) long f teii (FiLE *stream) returneaza pozitia relativ la inceput int fflush(FiLE *stream) scrie tampoanele de date nescrise pt fluxul de iesire stream Marius Minea 22 aprilie 2008 Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 2 O variabila x de tipul tip are o &x de tipul Variabila x ocupa sizeof(x) (sau: sizeof (tip )) octeti pornind de la &x Adresele sunt nenule Valoarea null (adresa 0) indica o adresa invalida, in tip t ; numele t e tabloului (elem ) si are tipul Functiile au ca parametri nu continutul tabloului, ci tabloului, void f (tip t ); e la fel ca void f(tip t □) si ca void f(tip *t); Functia care primeste adresa unei variabile o poate (si citi) Ex: scanf (atribuie valori citite de la intrare), functii cu tablouri (modifica tabloului, dar nu , transmisa prin !) O "sir" are tipul Valoarea constantei "sir" este de memorie unde se afla sirul Nu putem compara un char (’a’) cu un sir (adresa) "a" ! Comparam siruri cu str(n)cmp, nu cu == (compara adrese, nu continut) : au tip, valoare, locin memorie, adresa, pot fi declarati, atribuiti, tipariti, dati parametri, au operatii specifice Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 3 Pointer = o variabila care contine adresa altei variabile tip *nume var;    nume var e pointer la o valoare de tip operator prefix - operand: o variabila (ex x); rezultat: variabilei &x - folosit doar pt variabile (si elem tablou), nu constante, expresii, etc - se poate atribui unui pointer la acel tip: int x; int *p; p = &x; operator prefix - operand: pointer; rezultat: (variabila) indicat de pointer - *p e un , poate fi folosit la stanga unei atribuiri, ca si variabilele sau elem tablou; (orice poate fi la dreapta lui =) - daca p e &x, atunci *p e obiectul de la adresa p (a lui x), deci x int x, y, *p; p = &x; у = *p;  * у = x *  *p = у;    x = у Operatorul * e lui &: *&x e chiar x (obiectul de la adresa lui x) &*p e p (p: pointer cu valoare valida): adresa obiectului de la adresa p Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 4 Putem citi tip * p; tip * p; p are tipul tip * tip *p; *p e un caracter char **s;    adresa de adr de char char *t ;    tab de 8 adr de char CU Variabila int x = 5; int *p=&x; int **pp=&p; Adresa 0x408 0x51C 0x9D0 NU este o int x = 5; e la fel CU int x; x = 5; int t = { 3, 5 }; dar t = in cel mai bun caz, o comportare aleatoare - cu unei variabile (sau cu alt pointer initializat deja) - cu o adresa de memorie (vom discuta ulterior) : tip *p; *p = ceva; : char *p; scanf ("° os", p) ; - p este (eventual nul, daca e variabila globala) => valoarea va fi scrisa la o (evtl nula) => memorie corupta, vulnerabilitati de securitate, rulare abandonata ATENtiE: un pointer nu este un intreg Gresit: int *p = 640; ! Doar compilatorul sistemul de operare poate alege adresele, nu noi! Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 6 Avand adresa p a unei variabile ii putem : *p = functia care primeste adresa unei variabile poate modifica valoarea ei ex scanf primete , completeaza cu valorile citite dar parametrii sunt transmisi : adresa nu se modifica void swap (int *pa, int *pb) {    schimba valorile de la 2 adrese int tmp;    variabila temporara pentru valoarea schimbata prima tmp = *pa; *pa = *pb; *pb = tmp;    trei atribuiri de intregi Ex : int x = 3, у = 5; swap(&x, &y);    acum x = 5 si у = 3 Folosim: - cand limbajul ne obliga (tablouri ca parametri la functii) - pentru a intoarce mai multe rezultate (functia permite doar unul) ex minimul maximul unui tablou; rezultat cod de eroare Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 7 in limbajul C notiunile de pointer si nume de tablou sunt asemanatoare - declararea unui tablou aloca un bloc de memorie pt elementele sale - numele tabloului e adresa blocului respectiv (= a primului element) declarand tip a[LEN], *pa; putem atribui pa = a; &a e echivalent cu a iar a e echivalent cu *a Diferenta: adresa a e o constanta (tabloul e alocat la o adresa fixa) => nu putem atribui a = adresa, dar putem atribui pa = adresa pa e o variabila => ocupa spatiu are o adresa &pa memorie si Pxa 5C0 5E0 Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 8 in declaratii de functii, se pot folosi oricare din variante: size t strlen(char s []) ; sau size t strlen(char *s) ; la diferente! char s [] = "test"; s e ’t’, s e ’ 0’ etc s e o de tip char *, nu variabila cu loc in memorie NU se poate atribui s = , se poate atribui s = ’f’ sizeof(s) e 5 * sizeof (char) &s e chiar s (dar are alt tip, adresa de tablou de 5 char: char (*) ) char *p = "test"; la fel: p e ’t’, p e ’ 0’ etc p e o (char *), ocupa loc in memorie NU se poate atribui p = ’f ’ ("test" e o constanta sir), se poate atribui p = "ana"; sau p = s; si apoi p = ’f’ sizeof (p) e sizeof (char *) &p NU e p => e GREsiT: scanf ("° 04s" , &p); CORECT: scanf ("° 04s" , p); Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pomteri 9 O variabila v de un anumit tip ocupa sizeof (tip) octeti => &v + 1 reprezinta adresa la care s-ar putea memora urmatoarea variabila de acelasi tip (adresa cu sizeof (tip) mai mare decat &v) 1 unui intreg la un pointer: poate fi parcurs un tablou char *endptr(char *s) char *p = s; while (*p) p++; return p; {  * returneaza pointer la sfarsitul lui s *   * sau: char *p; p = s; *   * adica la pozitia marcata cu ’ 0’ *  2 : doar intre doi pointeri de acelasi tip tip *p, *q; = numarul (trunchiat) de obiecte de tip care incap intre cele 2 adrese - diferenta numerica in octeti: se convertesc ambii pointeri la char * p - q == ((char *)p - (char *)q)   sizeof(tip) Nu sunt definite nici un fel de alte operatii aritmetice pentru pointeri ! Se pot insa efectua operatii logice de comparatie (==, ! = , la parcurgere, in loc sa avansam indicele, incrementam pointerul char *strchr i(const char *s, int c) {    cauta caracter in sir for (int i = 0; s [i] ; ++i)    parcurge s cu indice i pana la ’ 0’ if (s[i] == c) return &s [i] ;    s-a gasit: returneaza adreasa return NULL;    nu s-a gasit: returneaza NULL (adresa invalida) char *strchr p(const char *s, int c) { for ( ;*s; ++s)    folosim chiar if (*s == c) return s;    s return NULL;    nu s-a gasit    scrisa folosind pointer parametrul pentru parcurgere indica caracterul curent Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 11 Fie un tablou bidimensional (matrice) declarat tip a[DlMl] [DiM2]; a[i] e adresa (constanta tip *) a unui tablou (linii) de DiM2 elemente a[i] [j] e al j-lea element din tabloul de DiM2 elemente a[i] ; adresa &a[i] [j] == a[i]+j e cu DlM2*i+j elemente dupa adresa tabloului a => o functie cu parametri tablou trebuie sa cunoasca toate dimensiunile in afara de prima => trebuie declarata tip-f i(tip-t t[] [DiM2]); char t ={"ian", ,"dec"}; t e un tablou 2-D de caractere i a n  o f e b  o • • • d e c  o si char *p ={"ian", ,"dec"}; P e un tablou de pointeri P ocupa 12*sizeof(char *) octeti (+ 12*4 octeti pt constantele sir) p ="iulie" modifica o adresa (elementul 7 din tabloul de adrese p) t ocupa 12 * 4 octeti t = e GREsiT (t e adresa constanta a liniei 7) Programarea calculatoarelor Curs 9 Marius Minea Programarea calculatoarelor Pointeri 12 Pe linia de comanda, dupa numele programului rulat, pot urma argumente (parametri): optiuni, nume de fisiere Exemple: gcc -Wall -o prog prog c is director cp fisierl fisier2 in C, avem acces la linia de comanda declarand main cu 2 parametri: int arge : nr de cuvinte din linia de comanda (nr argumente + 1) char *argv[] : tablou cu adresele argumentelor (siruri de caractere) #include int main(int arge, char *argv[]) { printf ("Numele programului: ° os n" , argv ); if (arge == 1) printf("Program apelat fara parametri n"); else for (int i = 1; i = 1 tabloul argv[] e incheiat cu un element null (argv[argc]) Programarea calculatoarelor Curs 9 Marius Minea 29 noiembrie 2004 Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 2 implicit, obiectele declarate la nivel de fisier sunt intr-un program (doua declaratii ale aceluiasi identificator in fisiere diferite reprezinta , v curs 3) => obiectul va fi intr-un singur fisier, in toate fisierele ce-l utilizeaza Declaratii care nu sunt definitii: - pentru variabile: cu specificatorul - pentru functii, doar prototipul (antetul), nu si corpul functiei Fazele compilarii: - compilarea in fisiere c -> o (cod masina, dar contine inca nume de variabile in loc de adrese fixe) - editarea de legaturi (linkeditarea): referintele la un identificator ( ) din toate fisierele obiect inlocuite prin aceeasi adresa Obiectele cu specificatorul nu sunt vizibile in afara fisierului => acelasi identificator poate fi refolosit pentru obiecte diferite Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 3 - cate un fisier pentru portiunile de cod care formeaza o entitate logica - cu un minim de interactiune (fara variabile globale nenecesare, etc ) - declaratiile de tipuri, functii si variabile ce trebuie exportate se pun intr-un fisier antet h - acesta e inclus de fiecare fisier c care il necesita - pentru a nu include declara in duplicat, se poate incadra in #ifndef -FiSiERULMEU H #define "FiSiERULMEU H  * aici vine continutul propriu-zis *  #endif chiar daca fisierul h e inclus repetat (din mai multe locuri), continutul sau e prelucrat doar o data (cand identificatorul ales nu e definit) Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 4 TDA = un model matematic cu un set de operatii asupra lui => o structura de date + functii care opereaza pe ea => notiunea de din programarea orientata pe obiecte Pentru implementarea TDA in C: - in fisierul h se declara minimul necesar pentru a putea compila programul (pentru structuri, adesea doar un typedef pt pointer la tip) - si declaratii de functii care manipuleaza tipul respectiv -structura tipului si definitiile functiilor: ascunse in implementare ( c) typedef struct node *list t;  * typedef struct node {  * int info;  * struct node *nxt; } node t;  * in fisierul h *  in fisierul c cu implementarea *  sau si alte campuri *  tip vizibil doar in fisierul c *  - utilizatorul, care include doar fisierul h nu are acces la structura interna a tipului (node t); accesul e permis doar prin functii care citesc sau modifica componentele unei variabile de acest tip (ca si pt file) Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 5 Spre programarea orientata pe obiecte: - : fara acces direct la reprezentarea TDA, componentele sale sunt accesate doar prin functii - functiile au de regula ca prim parametru obiectul pe care opereaza (sau pointer la el) - similar cu apelate pentru un obiect Decizii de proiectare: - ce operatii ca fie incluse - daca se transmit obiecte sau doar pointeri la obiecte (pointerii sunt necesari pentru functii care modifica obiectul) - daca rezultatul unei operatii e returnat (eventual alocat dinamic), sau depus intr-un obiect specificat (deja alocat) transmis ca parametru - daca functia returneaza un obiect, sau un cod de succes eroare (si obiectul e depus la adresa data de un pointer parametru) Vezi exemplele de cod pentru: numere complexe, matrici, multimi Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Recursivitate 6 Codul se scrie natural pornind de la definitia recursiva a structurii: Ex o lista este vida sau un element urmat de o lista Se pot defini atunci: - membru: e primul element, sau membru in coada listei - sterge: primul element, sau sterge din coada listei, etc La fel, se pot defini recursiv functii care copiaza sau transforma liste Productiile din gramatica unui limbaj sunt tipic recursive: expresie ::= termen | expresie + termen | expresie - termen termen ::= factor | termen * factor | termen   factor factor ::= numar | ( expresie ) Primele doua productii sunt recursive la stanga, pentru ca neterminalul din partea stanga a lui ::= apare si ca prim element intr-o varianta => se pot transforma si implementa (vezi exemplu) folosind cicluri Programarea calculatoarelor 2 Curs 9 Marius Minea 11 decembrie 2003 Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 2 Ca , de calculatoare, ne referim la un fisier prin Ca , ne intereseaza accesul la continutul fisierului, un sir (flux) de octeti (engl stream) in stdio h: tipul cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF), in program, lucram cu variabile transmise functiilor pt fisiere, (nu le dereferentiem niciodata, le folosim doar pt a indica fisiere) Secventa tipica de lucru: se deschide, se prelucreaza, se inchide fisierul Fisiere standard predefinite (deschise automat la rularea programului): : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) (sunt constante de tipul file * declarate in stdio h) De fapt, scanf printf etc fac citire scriere (de) la stdin stdout Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pt a putea fi separate (prin redirectare) de mesajele normale de iesire Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 3 FiLE *fopen (const char *path, const char *mode); - arg 1: numele fisierului (absolut sau fata de directorul curent) - arg 2: modul de deschidere; primul caracter semnifica: : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, e trunchiat la 0 (w) sau se adauga la sfarsit (append, a) in plus, sirul de caractere pt modul de deschidere mai poate contine: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod (implicit: in mod ) - returneaza null in caz de eroare (trebuie testat !!!) - altfel, valoarea returnata se foloseste pt lucrul in continuare int fclose(FiLE *stream); - scrie orice a ramas in tampoanele de date, inchide fisierul - returneaza 0 in caz de succes, EOF in caz de eroare Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 4 Tipar pt lucrul cu fisiere (ex deschis pt citire si scriere in mod text) FiLE *fp; char *name = "f txt";  * sau din argv[], sau solicitat *  if (! (f p = fopen(name, "rt+"))) {  * trateaza eroarea *  } else {  * lucreaza cu fisierul *  } if (fclose(fp))  * eroare la inchidere * ; La intrarea-iesirea in mod se pot petrece diverse conversii in functie de implementare (de exemplu traducere  n in  r n pt DOS) - modul : doar pt fisiere cu caractere tiparibile obisnuite ,  t,  n - modul binar  pt toate celelalte situatii (chiar si pt fisiere text) (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc , care e avansat automat de fiecare operatie => trebuie repozitionat corespunzator indicatorul cand trecem intre citire si scriere in acelasi fisier Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 5 Cu functii echivalente celor folosite pana acum: int fputc(int c, FiLE *stream);  * scrie caracter in fisier *  int fgetc(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s) ;  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ 0’ la sfarsit => citirea sigura a unei linii, fara depasire returneaza null daca apare EOF inainte de a fi citit ceva Utilizarea si programarea calculatoarelor Curs 9 Marius Minea #include void cat(FiLE *fi)  * afiseaza un fisier deschis car { int c; while ((c = fgetc(fi)) ! void main(int arge, char *argv[]) FiLE *fp; if (arge == 1) cat(stdin);  * c else while (—arge > 0) {  * pt if (!(fp = fopen(*++argv, "r" fprintf(stderr, "can’t open else { cat(fp); fclose(fp); } Utilizarea si programarea calculatoarelor Curs 9 б acter cu caracter *  = EOF) putchar(c); } iteste de la intrare *  fiecare argument *  )))  * deschide, testeaza *  ° os", *argv);  * afiseaza, inchide *  Marius Minea void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * != 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * != 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum) ; din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s) ;  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii void exit(int status) ; *stdlib h*  termina normal executia prog - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie un numar de octeti, neinterpretati (in format ): size t fread(void *ptr, size t size, size t nmemb, FiLE *stream); size t fwrite(void *ptr, size t size, size t nmemb, FiLE *stream);  * citesc scriu nmemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror Cu ele, putem sa ne scriem functii proprii pentru fiecare tip de date: size t readint(int *pn, FiLE *stream)  * in format binar *  { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *  { return fwrite(&x, sizeof(double), 1, stream); } fprintf (fp, "7od", n); scrie intregul ca sir de cifre zecimale cu fwrite se scrie intregul in format binar (sizeof (int) octeti Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 9 #include #include #define MAX 512  * copiem cate un sector odata *  int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;  * nr octeti cititi *  while (!feof(fi)) { size = fread(buf, 1, MAX, fi);  * citeste MAX octeti *  fwrite(buf, 1, size, fo);  * scrie doar cati s-au citit *  if (ferror(fi) || ferror(fo)) return errno; return 0; Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 10 void main(int argc, char *argv[]) FiLE *fi, *fo; if (argc != 3) { fprintf(stderr, "usage: сору source destination n"); exit(l); } else { if (! (fi = fopen(argv , "r"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (!(fo = fopen(argv , "w"))) { f printf (stderr, "70s: can’t open ° os: ", argv , argv ); perror(NULL); exit(errno); if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) | fclose(fo)) perror("Eroare la inchidere"); Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long ftell(FiLE *stream);  * pozitia de la inceputul fisierului *  int fseek(FiLE *stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: SEEK SET (inceput), seek cur (punctul curent), seek end (sfarsit) void rewind(FiLE *stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflush(FiLE *stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 12 Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf (s, "° od", &n) ;  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu ° on) *  Utilizarea si programarea calculatoarelor Curs 9 Marius Minea Fisiere 13 - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie #include sau #include "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) #define LEN 20  * preprocesorul inlocuieste LEN cu 20 peste tot *  int tab[LEN];  * programul trebuie modificat intr-un singur loc *  for (i=0; i (В) ? (A) : (B)) #define swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } fara interpretare => pot aparea probleme - folositi paranteze in jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Utilizarea si programarea calculatoarelor Curs 9 Marius Minea 29 noiembrie 2005 Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 2 Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: identificatorOpt { lista-constante } listadeclaratoriOpt ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - un nume de constanta nu poate fi folosit in mai multe enumerari - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante enum {D, L, Ma, Mc, J, V, S} zi;    tip anonim; declara doar var zi    tipul nu are nume ==> nu mai putem declara altundeva variabile int nr ore lucru ;  * numar de ore pe zi *  for (zi = L; zi putem avea: int 1; struct 1; goto 1; dar nu enum 1; struct 1; Putem folosi diverse variante de sintaxa: struct s {  * *   * apoi declaram *  struct s x, y; struct s { ** } x, y;  * declaram direct si var *  struct  { ** } x, y;    tip anonim, doar cu variabilele x, у typedef struct s {  * *  } s t; struct s x; s t y;    la fel Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 5 Accesul la campuri: se face cu sintaxa nume variabila, nume camp operatorul de (considerat operator postfix) struct student s; s nume = "Stefanovici"; strcpy(s telefon, "256123456"); s medie an = 9 35; initializarea structurilor: camp cu camp, intre acolade, ca si pentru alte agregate: struct point { float x, y; } pctl = { 2 5, 1 5 ( nume-tip ) { initializatori } - sunt obiecte fara nume, de tipul indicat; pot fi utilizate in program void drawpoint(struct point p); struct point p2; p2 = (struct point) { -1, 2 drawpoint((struct point) { 1 5, 2 5 }); Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 6 - facuta de compilator in ordinea declararii campului - pot fi insa spatii goale intre campuri pentru lor eficienta, struct s { char c;   la deplasamentul 0 in structura int n;    poate la deplasament 4 (pe arh de 32 biti) char a ;    poate dupa el sunt doi octeti liberi double d;    pentru ca d sa fie tot la multiplu de 4 i x; Putem afla dispunerea campurilor facand diferente intre adresele lor: (char *)&x n - (char *)&x indica deplasamentul campului n (conversie pt pointeri de acelasi tip, char * pt dimensiune numerica) La fel: macro-ul offsetof(tipstruct, numecamp) (stddef h) offsetof (struct s, n) da deplasamentul lui n in structura s Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 7 Structurile fi atribuite in totalitatea lor struct point pl, p2; pl = p2; Structurile fi transmise catre   returnate de functii Pt dimensiuni mari, se prefera transmiterea   returnarea de pointeri Structurile fi comparate cu operatori logici => trebuie comparate individual campurile lor ! Compararea zonei de memorie cu memcmp: doar daca structurile sunt initializate la fel (spatiile goale pot avea valori nedeterminate)! int memcmp(const void *sl, const void *s2, size t n); (returneaza 0 la egalitate, sau diferenta intre primii doi octeti neegali) struct {  * ceva campuri *  } x, y; if (memcmp(&x, &y, sizeof x)) {  * sunt diferite *  } Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 8 Frecvent: accesul la campuri prin intermediul unui pointer la structura: struct student *p;  * p = *  (*p) nota dipl = 9 50; Operatorul -> e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si () si □ Atentie la ordinea de evaluare ! p->x++ ++p->x *p->x *p->s++ msea insea insea insea mna mna mna mna (p->x)++ ++(p->x) *(p->x) *((p->s)++) Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 9 in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie",  * , *  "decembrie" }; char zile luna = { 31, 28, 31, 30,  * , *  30, 31 };  * e preferabila varianta urmatoare *  typedef struct { char *nume; int zile; } tip luna; tip luna luni = {{"ianuarie",31},  * ,*  {"decembrie",31}}; Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 10 Exceptional, ultimul camp dintr-o structura cu mai poate fi tablou fara dimensiune specificata - dimensiunea structurii e deplasamentul unei structuri tabloul ar avea elemente (tine cont de aliniere) - folosire: prin alocare dinamica, cu lungimea dorita a typedef struct s { int 1; char s [] ; } string; string *ps; char tab[] = "un sir"; int 1 = strlen(tab); ps = malloc(sizeof(struct s) +1); if (ps) { ps->l = 1; memcpy(ps->s, tab, 1); Programarea calculatoarelor 2 Curs 6 multe campuri identice in care tabloului: Marius Minea Tipuri definite de utilizator 11 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl { char *word; struct wl *next;  * tag-ul wl e necesar in declararea lui next *   * informatia propriu-zisa *   * pointer la acelasi tip de structura *   * defineste tipul struct wl *  Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  * struct t { int val; tree *left, *right;  * };  * tree si defineste tipul incomplet tree *  foloseste numele din typedef *  struct t sunt complete si echivalente *  Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 12 Se pot declara campuri intregi cu un numar specificat de biti => Testarea setarea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : int const ; | : int const ; struct packet { int : 2; int error: 1; int status: 3; int : 0; int seq no: 4;  * primii doi biti nu intereseaza *   * intreg pe un bit: 0 sau 1 *   * intreg pe 3 biti: 0 7 *   * forteaza alinierea la octetul urmator *   * intreg pe 4 biti: 0 15 *  } pkt; if (pkt error) { } else if (pkt status == 5) { } else pkt seq no++; Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 13 Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { lista campuri } opt lista declaratori ; Lista de campuri este insa o lista de variante: - o variabila contine campurile declarate - o variabila contine din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune informatii despre varianta reprezentata - acest lucru trebuie memorat in program (in alta variabila) Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 14 Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) - date suplimentare pentru identificatori (nume) si constante (valoare) enum tok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , СОММА, typedef union { char *id;  * sir de caractere pentru identificator *  int ival;  * valoare pentru constanta intreaga *  float fval;  * valoare pentru constanta reala *  } lexvalue; enum tok token; lexvalue iv; switch (token) { case iDENT: printf ("° os", iv id); break; case iNUM: printf ("° od", iv ival); break; case FNUM: printf ("° of", iv fval); break; Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator 15 - definirea unor nume de tip (typedef) faciliteaza intelegerea codului - tablouri: folositi dimensiuni constante simbolice (nu direct numere) (modificarile ulterioare sunt necesare intr-un singur punct in program) #define LEN 20  * LEN e substituit cu 20 de preprocesor *  int a[LEN], i; for (i = 0; i definiti pentru acestea cu typedef tipuri modificabile ulterior => folositi tipurile oferite de limbaj (ex size t) Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator 29 noiembrie 2005 Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: identificatorOpt { lista-constante } listadeclaratoriOpt ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}-; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - un nume de constanta nu poate fi folosit in mai multe enumerari - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante enum {D, L, Na, Mc, J, V, S} zi;    tip anonim; declara doar var zi    tipul nu are nume ==> nu mai putem declara altundeva variabile int nr ore lucru ;  + numar de ore pe zi +  for (zi = L; zi putem avea: int 1; struct 1; goto 1; dar nu enum 1; struct 1; Putem folosi diverse variante de sintaxa: struct s{  ++ }; + apoi declaram +  struct s x, y; struct s { ** } x, y;  * declaram direct si var *  struct { ** } x, y;    tip anonim, doar cu variabilele x, у typedef struct s {  * *  } s t; struct s x; s t y;    la fel Programarea calculatoarelor 2 Curs 6 Marius Minea Accesul la campuri: se face cu sintaxa nume variabila nume camp operatorul de (considerat operator postfix) struct student s; s nume = "Stefanovici"; strcpy(s telefon, "256123456"); s medie an = 9 35; initializarea structurilor: camp cu camp, intre acolade, ca si pentru alte agregate: struct point { float x, y; } pctl = { 2 5, 1 5 }; ( nume-tip ) { initializatori } - sunt obiecte fara nume, de tipul indicat; pot fi utilizate in program void drawpoint(struct point p); struct point p2; p2 = (struct point) { -1, 2 }; drawpoint((struct point) { 1 5, 2 5 }); Programarea calculatoarelor 2 Curse Marius Minea - facuta de compilator in ordinea declararii campului - pot fi insa spatii goale intre campuri pentru lor eficienta, struct s { char c;    la deplasamentul 0 in structura int n;    poate la deplasament 4 (pe arh de 32 biti) char a ;    poate dupa el sunt doi octeti liberi double d;    pentru ca d sa fie tot la multiplu de 4 } x; Putem afla dispunerea campurilor facand diferente intre adresele lor: (char *)&x n - (char *)&x indica deplasamentul campului n (conversie pt pointeri de acelasi tip, char * pt dimensiune numerica) La fel: macro-ul offsetofft pstruct, numecamp) (stddef h) offsetof (struct s, n) da deplasamentul lui n in structura s Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator Tipuri definite de utilizator Structurile fi atribuite in totalitatea lor struct point pl, p2; pl = p2; Structurile fi transmise catre   returnate de functii Pt dimensiuni mari, se prefera transmiterea   returnarea de pointeri Structurile fi comparate cu operatori logici => trebuie comparate individual campurile lor ! Compararea zonei de memorie cu memcmp: doar daca structurile sunt initializate la fel (spatiile goale pot avea valori nedeterminate)! int memcmp(const void *sl, const void *s2, size t n) ; (returneaza 0 la egalitate, sau diferenta intre primii doi octeti neegali) struct {  * ceva campuri *  } x, y; if (memcmp(&x, &y, sizeof x) ) {  * sunt diferite *  } Programarea calculatoarelor 2 Curs 6 Marius Minea Frecvent: accesul la campuri prin intermediul unui pointer la structura: struct student *p;  * p = *  (*p) nota dipl = 9 50; Operatorul -> e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (tpointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si () si [] Atentie la ordinea de evaluare ! p->x++ ++p->x +p->x *p->s++ inseamna inseamna inseamna inseamna (p->x)++ ++(p->x) +(p->x) *((p->s)++) Programarea calculatoarelor 2 Curs 6 Marius Minea in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie",  + , +  "decembrie" }; char zile luna = { 31, 28, 31, 30,  + , +  30, 31 };  * e preferabila varianta urmatoare +  typedef struct { char *nume; int zile; } tip luna; tip luna luni = {{"ianuarie",31},  * ,*  {"decembrie",31}}; Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator Tipuri definite de utilizator Exceptional, ultimul camp dintr-o structura cu mai multe campuri poate fi tablou fara dimensiune specificata -dimensiunea structurii e deplasamentul unei structuri identice in care tabloul ar avea elemente (tine cont de aliniere) -folosire: prin alocare dinamica, cu lungimea dorita a tabloului: typedef struct s { int 1; char s [] ; } string; string *ps; char tab [] = "un sir"; int 1 = strlen(tab); ps = malloc(sizeof(struct s) +1); if (ps) { ps->l = 1; memcpy(ps->s, tab, 1); } Programarea calculatoarelor 2 Curs 6 Marius Minea Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {  * tag-ul wl e necesar in declararea lui next *  char +word;  + informatia propriu-zisa +  struct wl +next;  + pointer la acelasi tip de structura +  };  + defineste tipul struct wl +  Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  + defineste tipul incomplet tree +  struct t { int val; tree *left, +right;  + foloseste numele din typedef +  };  + tree si struct t sunt complete si echivalente +  Programarea calculatoarelor 2 Curs 6 Marius Minea Se pot declara campuri intregi cu un numar specificat de biti => Test a rea set a rea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : int-COnst ; | : int-COnst ; struct packet { int : 2;  * primii doi biti nu intereseaza +  int error: 1;  + intreg pe un bit: 0 sau 1 +  int status: 3;  + intreg pe 3 biti: 0 7 +  int : 0;  + forteaza alinierea la octetul urmator +  int seq no: 4;  + intreg pe 4 biti: 0 15 +  } pkt; if (pkt error ) { } else if (pkt status == 5) { } else pkt seq no++; Programarea calculatoarelor 2 Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator Tipuri definite de utilizator Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { lista campuri } optJista declaratori ; Lista de campuri este insa o lista de variante: - o variabila contine campurile declarate - o variabila contine din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune informatii despre varianta reprezentata - acest lucru trebuie memorat in program (in alta variabila) Programarea calculatoarelor 2 Curs 6 Marius Minea Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) -date suplimentare pentru identificatori (nume) si constante (valoare) enum tok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , СОММА, typedef union { char + id;  + sir de caractere pentru identificator +  int ival;  * valoare pentru constanta intreaga *  float fval;  + valoare pentru constanta reala +  } lexvalue; enum tok token; lexvalue iv; switch (token) { case iDENT: printf("%s", iv id); break; case iNUM: printf("%d", lv ival); break; case FNUM: printf("%f", iv fval); break; } Programarea calculatoarelor 2 Curse Marius Minea - definirea unor nume de tip (typedef) faciliteaza intelegerea codului - tablouri: folositi dimensiuni constante simbolice (nu direct numere) (modificarile ulterioare sunt necesare intr-un singur punct in program) #define LEN 20  * LEN e substituit cu 20 de preprocesor *  int a [LEN], i; for (i = 0; i definiti pentru acestea cu typedef tipuri modificabile ulterior => folositi tipurile oferite de limbaj (ex size t) Programarea calculatoarelor 2 Curs 6 Marius Minea 30 noiembrie 2005 Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte 2 implicit, obiectele declarate la nivel de fisier sunt intr-un program (doua declaratii ale aceluiasi identificator in fisiere diferite reprezinta , v curs 3) => obiectul va fi intr-un singur fisier, in toate fisierele ce-l utilizeaza Declaratii care nu sunt definitii: - pentru variabile: cu specificatorul - pentru functii, doar prototipul (antetul), nu si corpul functiei Fazele compilarii: - compilarea in fisiere c -> o (cod masina, dar contine inca nume de variabile in loc de adrese fixe) - editarea de legaturi (linkeditarea): referintele la un identificator ( ) din toate fisierele obiect inlocuite prin aceeasi adresa Obiectele cu specificatorul nu sunt vizibile in afara fisierului => acelasi identificator poate fi refolosit pentru obiecte diferite Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte 3 - cate un fisier pentru portiunile de cod care formeaza o entitate logica - cu un minim de interactiune (fara variabile globale nenecesare, etc ) - declaratiile de tipuri, functii si variabile ce trebuie exportate se pun intr-un fisier antet h - acesta e inclus de fiecare fisier c care il necesita - pentru a nu include declara in duplicat, se poate incadra in #ifndef -FiSiERULMEU H #define "FiSiERULMEU H  * aici vine continutul propriu-zis *  #endif chiar daca fisierul h e inclus repetat (din mai multe locuri), continutul sau e prelucrat doar o data (cand identificatorul ales nu e definit) Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte 4 TDA = un model matematic cu un set de operatii asupra lui => o structura de date + functii care opereaza pe ea => notiunea de din programarea orientata pe obiecte Pentru implementarea TDA in C: - in fisierul h se declara minimul necesar pentru a putea compila programul (pentru structuri, adesea doar un typedef pt pointer la tip) - si declaratii de functii care manipuleaza tipul respectiv -structura tipului si definitiile functiilor: ascunse in implementare ( c) typedef struct node *list t;  * typedef struct node {  * int info;  * struct node *nxt; } node t;  * in fisierul h *  in fisierul c cu implementarea *  sau si alte campuri *  tip vizibil doar in fisierul c *  - utilizatorul, care include doar fisierul h nu are acces la structura interna a tipului (node t); accesul e permis doar prin functii care citesc sau modifica componentele unei variabile de acest tip (ca si pt file) Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte 5 Spre programarea orientata pe obiecte: - : fara acces direct la reprezentarea TDA, componentele sale sunt accesate doar prin functii - functiile au de regula ca prim parametru obiectul pe care opereaza (sau pointer la el) - similar cu apelate pentru un obiect Decizii de proiectare: - ce operatii ca fie incluse - daca se transmit obiecte sau doar pointeri la obiecte (pointerii sunt necesari pentru functii care modifica obiectul) - daca rezultatul unei operatii e returnat (eventual alocat dinamic), sau depus intr-un obiect specificat (deja alocat) transmis ca parametru - daca functia returneaza un obiect, sau un cod de succes eroare (si obiectul e depus la adresa data de un pointer parametru) Vezi exemplul de cod pentru liste de intregi Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Tipuri de date abstracte 30 noiembrie 2005 Programarea calculatoarelor 2 Curs 9 Marius Minea implicit, obiectele declarate la nivel de fisier sunt intr-un program (doua declaratii ale aceluiasi identificator in fisiere diferite reprezinta , v curs 3) => obiectul va fi intr-un singur fisier, in toate fisierele ce-l utilizeaza Declaratii care nu sunt definitii: - pentru variabile: cu specificatorul - pentru functii, doar prototipul (antetul), nu si corpul functiei Fazele compilarii: - compilarea in fisiere c -> o (cod masina, dar contine inca nume de variabile in loc de adrese fixe) - editarea de legaturi (linkeditarea): referintele la un identificator ( ) din toate fisierele obiect inlocuite prin aceeasi adresa Obiectele cu specificatorul nu sunt vizibile in afara fisierului => acelasi identificator poate fi refolosit pentru obiecte diferite Programarea calculatoarelor 2 Curs 9 Marius Minea - cate un fisier pentru portiunile de cod care formeaza o entitate logica -cu un minim de interactiune (fara variabile globale nenecesare, etc ) - declaratiile de tipuri, functii si variabile ce trebuie exportate se pun intr-un fisier antet h - acesta e inclus de fiecare fisier c care il necesita - pentru a nu include declara in duplicat, se poate incadra in Sifndef FiSiERULMEU H Sdefine FiSiERULMEU H  * aici vine continutul propriu-zis *  Sendif chiar daca fisierul h e inclus repetat (din mai multe locuri), continutul sau e prelucrat doar o data (cand identificatorul ales nu e definit) Programarea calculatoarelor 2 Curs 9 Marius Minea Tipuri de date abstracte Tipuri de date abstracte TDA = un model matematic cu un set de operatii asupra lui => o structura de date + functii care opereaza pe ea => notiunea de din programarea orientata pe obiecte Pentru implementarea TDA in C: - in fisierul h se declara minimul necesar pentru a putea compila programul (pentru structuri, adesea doar un typedef pt pointer la tip) - si declaratii de functii care manipuleaza tipul respectiv -structura tipului si definitiile functiilor: ascunse in implementare ( c) typedef struct node *list t; typedef struct node { int info; struct node *nxt; } node t;  + in fisierul h +   + in fisierul c cu implementarea +   * sau si alte campuri *   + tip vizibil doar in fisierul c +  - utilizatorul, care include doar fisierul h nu are acces la structura interna a tipului (node t); accesul e permis doar prin functii care citesc sau modifica componentele unei variabile de acest tip (ca si pt file) Programarea calculatoarelor 2 Curs 9 Marius Minea Spre programarea orientata pe obiecte: - : fara acces direct la reprezentarea TDA, componentele sale sunt accesate doar prin functii - functiile au de regula ca prim parametru obiectul pe care opereaza (sau pointer la el) - similar cu apelate pentru un obiect Decizii de proiectare: - ce operatii ca fie incluse - daca se transmit obiecte sau doar pointeri la obiecte (pointeri! sunt necesari pentru functii care modifica obiectul) - daca rezultatul unei operatii e returnat (eventual alocat dinamic), sau depusintr-un obiect specificat (deja alocat) transmis ca parametru - daca functia returneaza un obiect, sau un cod de succes eroare (si obiectul e depus la adresa data de un pointer parametru) Vezi exemplul de cod pentru liste de intregi Programarea calculatoarelor 2 Curs 9 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  27 noiembrie 2017 Sisteme cu comportament simplu: un model pentru calcule cu (multimi de siruri) de o forma simpla: concatenare, alternativa, repetitie (utilizator): introdu fisa, apasa buton (automat): toarna cafea Dupa o actiune ceva ? buton nu fisa nu imediat fisa buton da fisa a avut un efect : automatul a trecut in alta (se la actiunea buton) fisa fisa buton buton daca da, cate fise poate tine minte ? da doua cafele ? una sau mai multe, dar practic un numar Multe sisteme se pot modela ca automate: numaratoare, afisaje, control simplu pornit oprit de comunicatie: trimite, primeste, asteapta, Automatele sunt un pentru ce se poate cu (automate cu numar finit de stari) Alte probleme legate de automate: cu diverse : corespunde specificatiei? Putem (deduce) forma automatului din comportament? Dupa un sir cu numar Dupa un sir cu numar => automatul poate incepe in so cand primeste 1, schimba starea cand primeste O, sta pe loc , automatul va fi in , automatul va fi in cele doua feluri de siruri Daca vrem un numar impar de 1, marcam si ca : doar daca la final automatul e in stare acceptoare => automatul defineste o , adica un e o multime de (caractere) {a, b, c} sau {0,1} sau {0,1, ,9}, Cu simbolurile din alfabet putem forma ( , secvente): aba, 010010, 437, Un e o (siruri) ca orice multime, definita explicit: {a, ab, ac, abc} sau dupa o regula: siruri de a, b, incep cu a, mai multi a decat b schema: http:  web stanford edu class cslO3 lectures 14 Smalll4 pdf Fie un E: o multime de (ex caractere) Un finit peste alfabetul E e un din E aia2 an 3  G E oricate in orice ordine Notam cu E* multimea cuvintelor peste alfabetul E E* = {зіз2 an i 3  G E} * steaua Kleene: ( aparitii) contine : repetitie de zero ori (vezi ciclul while) important: E* are cuvinte de lungime , dar nu infinite Un  eo multime de cuvinte   С E*, definita dupa anumite automate, expresii regulate, gramatici, etc limbajul sirurilor de paranteze echibrate; al sirurilor palindrom; al sirurilor de 0 si 1 care nu au trei 0 consecutivi; etc Un automat e dat de: de intrare (de ex un caracter, sau o actiune externa, apasarea unui buton) trecerile dintr-o stare in alta ( ) starea unde vrem sa ajungem (starile ) Formal, un automat finit e un tuplu cu 5 elemente (E, S, sq, 6, F) E e un finit nevid de de intrare {a,0,1, } S e o multime finita nevida de % e Se (una, in definitia uzuala) — 5 : S x E -> S e 0^0 : la orice stare si intrare, o stare urmatoare F C S e multimea starilor (Q) in final, vrem sa fim aici daca sirul e bun (din limbaj) automat de : accepta siruri de 0 si 1 cu numar par de 1 CZ) in acelasi timp sq e stare initiala si acceptoare Starile acceptoare pot avea tranzitii: aici, din so se iese la citirea lui 1 conteaza starea in care ajunge cand se termina sirul automat care accepta cuvinte cu oricati de b (inel 0) intre doi a ca 6 sa fie definita peste tot e necesara inca o stare err in practica se poate omite daca dintr-o stare nu e tranzitie automatul s-a blocat, sirul nu e bun b a, b Notam ее Г* cuvantul (fara niciun simbol) Definim o functie de tranzitie 6* : S x E* —> S cu intrari in ce stare ajunge automatul pentru un cuvant dat la intrare? Pentru orice stare s G S, definim inductiv: 5*(s, e) = s cuvant vid: nu face nimic 5*(s, 3132 зп) = 5*(5(s, 3i), 32 зп) pentru n > 0 Altfel spus, 6*(so, З1З2 зп) = 5*(si, 32 зп) cu si = 5(so, 3i) obtinem starea si dupa intrarea 3i, si aplicam 6* pe sirul ramas Automatul (cuvantul cuvantul w G E* daca si numai daca 5*(sp, w) G F automatul intr-o stare ) Matrice S x E cu elemente din S (pentru fiecare stare si intrare, starea urmatoare) reprezinta fiecare combinatie a b So So Si Si Si So Sau: un dictionar care da pentru fiecare stare functia de tranzitie reprezentata tot ca un (intrare, stare) Daca dintr-o stare multe simboluri duc in aceeasi stare urmatoare, asociem fiecarei stari: un dictionar (intrare, stare) o stare urmatoare implicita (pentru celelalte intrari) numite si (engl transducer) scopul: genereaza raspunsuri iesiri; nu au multime acceptoare F in plus: un fi si o g automate de tip iesirea e functie de g : S —> fi automate de tip iesirea e functie de si g : S x E —> fi folosite pentru a modela discutate la disciplina Logica digitala Un limbaj recunoscut de un automat se numeste vom vedea ca se poate exprima prin Automatul pentru a doua limbaje П  2 (numit uzual automatul produs) are stari din produsul cartezian Si x S2 al starilor tranzitioneaza accepta daca in ambele automate accepta: Automatul pentru tranzitioneaza accepta daca a doua limbaje  1 U  2 in ambele automate (ca mai sus) accepta Automatul pentru   accepta daca automatul original nu accepta (complementam F) mai intai scriem automatul riguros complet (nu cu tranzitii lipsa) Exemplu: toate sirurile de a, b, c care se in abc a, b, c Din so, primind simbolul a, automatul poate - ramane in sp - trece in si => automatul poate urma cai Un NFA accepta daca o alegere ducand in stare acceptoare Daca pentru un sir bc alegem sa trecem in si la simbolul (antepenultimul simbol), sirul va fi acceptat un subsir ab Toate sirurile de a, b, c care a, b, c a, b,c Odata gasit ab, sirul e bun, oricum ar continua tranzitiile din starea acceptoare trec tot in stare acceptoare Avantaje: uneori se scrie mai usor decat un automat determinist (trebui sa descriem calea acceptoare, nu toate celelalte) e util cand un sistem: putem lasa deschise mai multe posibilitati, ne permite o alegere la implementare Functia de tranzitie e acum o in care poate trece automatul (0 sau mai multe) e echivalenta cu o : orice multime C S x E x S de tranzitii (stare SiF^01 stare) defineste un automat nedeterminist Un NFA accepta daca o alegere ducand in stare acceptoare Accepta sirul aia2- an daca sirul de stari so Д- si sn cu Sk G 6(sk-i, Эк) (к > 1) si sn G F (acceptoare) Un NFA poate sa aiba tranzitii lipsa: a(s, a) = 0 (multimea vida) Nu afecteaza notiunea de sir acceptat: ne intereseaza doar daca exista o cale acceptoare, chiar daca se blocheaza pe altele (accepta aceleasi siruri) Prezentam cum facem conversia Fie un NFA M = (Z, S, sq, 6, F) Construim un DFA echivalent Retinem la orice pas multimea de stari in care s-ar putea afla M o stare in noul automat e o din automatul initial noua multime de stari va fi poate fi exponential in dimensiunea initiala, |P(S)| = Obtinem automatul M' = (E, S', sp, У, F') cu S' = P(S) 6'(q, a) = 5(s, a) pentru fiecare stare s G q cu q G P(S), reunim multimile starilor in care se ajunge pe simbolul a F' = {s G S' | s П F ф 0} multimea starilor care au o stare acceptoare din F accepta daca care duce in stare acceptoare Cand obtinem o noua multime ( ) adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} Cand obtinem o noua multime ( ) adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} Cand obtinem o noua multime ( ) adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} Cand obtinem o noua multime ( ) adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} {0,3} {0,1} {0} {0} a, b, с Cand obtinem o noua multime ( ) adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} {0,3} {0,1} {0} {0} Fiecare multime obtinuta devine o stare in DFA-ul rezultat Starile acceptoare sunt cele care contin o stare acceptoare din automatul initial 2 3 4 5 6 7 8 {1} stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal а d 2 3 4 5 б 7 | 8 | stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} а d 2 3 4 5 б 7 | 8 | stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} а d {23,6,8} 2 3 4 5 б 7 | 8 | stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d' muta diagonal а d {23,6,8} {23,6,8} {13,5,7,9} 2 3 4 5 6 7 8 stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {23} {5} {1, 3,5,7} {23,6,8} а d {23,6,8} {23,6,8} {13,5,7,9} {23,6,8} 2 3 4 5 6 7 8 stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} {1, 3,5,7} {2,4, 6,8} {1,3, 7 9} а d {23,6,8} {23,6,8} {13,5,7,9} {23,6,8} {23,6,8} {5} 2 3 4 5 6 7 8 stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal a d {1} {2,4} {5} {2,4, 6, 8} {1,3,5,7} {2,4, 6, 8} {1,3,5,7,9} {2,4, 6,8} {2,4,6,8} {1,3, 7,9} {2,4, 6, 8} {5} {1,3,5,7,9} {2,4, 6, 8} {1,3,5,7,9} 2 3 4 5 6 7 8 stare initiala: 1 stare accept : 9 E = {a,d} a: muta adiacent d: muta diagonal a d {1} {2,4} {5} {2,4, 6, 8} {1,3,5,7} {2,4, 6, 8} {1,3,5,7,9} {2,4, 6,8} {2,4,6,8} {1,3, 7,9} {2,4, 6, 8} {5} {1,3,5,7,9} {2,4, 6, 8} {1,3,5,7,9} 1- 7 = {1,3,5,7} 2- 8 = {2,4,6,8}  5 = {1,3,7, 9} 1-9 = {1,3,5,7,9} Un limbaj = o multime de cuvinte peste un alfabet Adesea ne intereseaza cuvinte cu structura simpla, "regulata": un : o secventa de cifre, eventual cu semn un : parte intreaga + parte zecimala (una din ele optionala), exponent optional un : litere, cifre, incepand cu litera sau : 01-t 't7u mp3, 02-a tt t u mp3, Unele limbaje pot fi recunoscute eficient de dar scrierea automatului ia efort => se pot scrie mai simplu ca limbajelor regulate sunt limbaje regulate Mai putem defini: limbajelor Z-l • Z-2 = {и іИ 2 | Wl G  -1, w2 G  -2} orice cuvant din   i urmat de orice cuvant din   2 (repetitia) L* = {w i G N w = И 1И 2 • • • wn, и   G   } concatenarea siruri din L, nu neaparat acelasi sir luand n = 0, rezulta (niciun simbol, lungime 0) notam sirul vid cu epsilon: e G L* pentru orice L ф 0 O expresie regulata descrie un limbaj (regulat) O expresie regulata peste un alfabet E e fie: 3 cazuri de baza: 0 limbajul vid e limbajul {e} (cu sirul vid) a limbajul {a} cu a G E (un cuvant de o litera) 3 cazuri recursive: date еі,ег expresii regulate, putem forma: ei + e2 limbajelor in practica, notata adesea еі|ег ( , "sau") ei • e2 limbajelor ej a limbajului Omitem paranteze cand sunt clare din relatiile de precedenta cel mai prioritar: *, apoi concatenare si apoi reuniune + punctul pentru concatenare se omite in practica se mai folosesc abrevierile e? pentru e + e (e, optional) e+ pentru e*   e (e, cel putin o data) (0 + 1)* multimea tuturor sirurilor din 0 sau 1 (0 + l)*0 ca mai sus, incheiat cu 0 (numere pare in binar) 1(0 + 1)* + 0 numere binare, fara zerouri initiale inutile Constructie data de Ken Thompson (creatorul UNiX, premiul Turing 1983) Definim prin cum traducem cele 3 de expresie regulata cum automatele in cele 3 =^- descompunand, convertim nu are stare acceptoare starea initiala sau e acceptoare in automat nu consuma simbol in cele trei cazuri recursive, automatele limbajelor date automat finit nedeterminist cu tranzitii (nu consuma simbol) Combinam automatele pentru cele doua expresii regulate (in oval pot fi alte stari si tranzitii) Starea initiala si finala au tranzitii e spre din automatele originale, fara a consuma simboluri => pot parcurge oricare din automate ei + e2 Adaugam tranzitii e (sirul vid) care nu consuma niciun un simbol: -inchid ciclul stare finala Д initiala in automatul pentru e -trec direct din starea initiala in cea finala (sirul vid, 0 iteratii) - leaga noua stare initiala si finala de cele ale expresiei interioare e eie2 Constructiile de pana acum asigura: o unica stare initiala, in care nu se revine o unica stare acceptoare, din care nu ies tranzitii Atunci putem contopi la concatenare capetele lui ei si e2 eie2 Neavand tranzitii spre starea initiala si din cea acceptoare, simplificam: La , comasam cele doua stari initiale si finale ei + e2 La inchiderea Kleene, comasam starea initiala cu cea finala; cei doi e consecutivi ne dau cazul cu zero repetitii Fie expresia regulata (0+10)*(l+e) Construim pas cu pas: O se face spontan, fara a consuma un simbol de intrare => din starea s se ajunge in orice s' legata prin oricate e-tranzitii ( a relatiei definite de e) Ajuns in 1, s-ar putea afla si in 2, 4 sau 5 => starea initiala e de fapt multimea {1,2,4,5} Ajuns in 2, s-ar putea afla si in 4 sau 5 => multimea {2,4,5}, etc ,0 Tranzitiile pe 0 ne duc direct in , apoi prin e in 4 si 5 Liniile 1 si 2 au destinatii identice =^- starile sunt echivalente => automat cu doar doua stari (ignorand starea de eroare 0) Ambele contin pe 5 => sunt acceptoare Vrem sa ramanem doar cu cu tranzitiile etichetate de (initial si acceptor), (parti din expresia regulata) (extindem notatia de automat doar in cadrul acesei constructii; riguros automatele consuma doar simbol pe tranzitie) Daca sunt > 1 noduri acceptoare, si ducem din fiecare stare acceptoare tranzitii e spre el pe rand in afara de cel initial si acceptor: pentru orice nod intermediar  ' de eliminat pentru orice pereche de noduri (s, d) adauga la muchia s —> d limbajul LsjL^Ljd (tranzitionam din s —>  ', repetam indefinit   —>  ', apoi   —> d) siruri de O si 1 care nu au doi 1 consecutivi pe 1, trece in starea si cu tranzitie doar pe 0 Ambele stari sunt acceptoare => adaugam o unica stare acceptoare sO sf Eliminam sl: sO sO 0 10 Obtinem astfel limbajul (0+10)*(l+e) Doua stari si si pot fi daca exista un cuvant w care dintr-una din stari conduce la o stare acceptoare, si din cealalta, nu 5*(si, w) G F ф 5*(s2, w) g F Doua stari care nu pot fi deosebite sunt => pot fi inlocuite cu o singura stare Un DFA e daca nu exista un automat cu mai putine stari care accepta acelasi limbaj Diversi (ex Hopcroft-Ullman, Moore) initial, partitie cu 2 blocuri: F, S   F (stari acceptoare sau nu) (o impartire in potentiale clase de echivalenta) desparte un bloc din partitie daca pe un simbol, starile nu trec toate in acelasi bloc din partitie (pot fi deosebite) Cuvinte din a, b cu subsir aba', "ghicim" cand incepe subsirul dorit a,b a,b a b 0 01 0 01 01 02 02 013 0 013 023 013 03 013 03 Starile care contin 3 (stare acceptoare) sunt Aici, ele trec tot timpul in stari acceptoare, deci sunt (caz simplu), si le putem comasa intr-o singura stare (numita 3) b Un finit determinist defineste un Un astfel de limbaj se numeste El poate fi exprimat si printr-o intersectia, reuniunea, si complementul limbajelor regulate produc , la fel concatenarea si inchiderea Kleene deci pot fi Automatele finite se pot transforma in deci recunosc tot limbaje regulate dar numarul de stari poate creste exponential Automatele finite pot fi , comasand Automatele deterministe si nedeterministe si expresiile regulate au (descriu limbaje regulate) Fisiere Programarea calculatoarelor Curs 10 5 mai 2009 Marius Minea La nivel de , ne referim la un fisier prin La nivelul , bibliotecile limbajului C definesc un tip cu elementele necesare accesului la fisier (pozitia curenta in fisier, tamponul de date, indicatori de eroare si EOF) in programe se folosesc doar pointeri la acest tip: Din punct de vedere logic, un fisier e un flux (stream) de octeti Lucrul tipic cu fisiere: se deschide, se prelucreaza, se inchide Fisiere standard predefinite (si deschise automat la rulare) : fisierul standard de intrare (normal: tastatura) : fisierul standard de iesire (normal: ecranul) : fisierul standard de eroare (normal: ecranul) Obs: E bine ca mesajele de eroare sa fie scrise la stderr, pentru a putea fi separate (prin redirectare) de mesajele normale de iesire Programarea calculatoarelor Curs 10 Marius Minea Fisiere 3 Fisiere 4 FiLE *fopen (const char *path, const char *mode); arg 1 (sir): numele fisierului (absolut sau fata de directorul curent) arg 2 (sir): modul de deschidere; primul caracter semnifica: fopen returneaza null in caz de eroare (trebuie testat ii!) Altfel, valoarea returnata (un file*) e folosita pt lucrul in continuare : deschidere pentru citire (fisierul trebuie sa existe) , : deschidere pt scriere; daca fisierul nu exista, e creat; daca exista, e trunchiat la 0 (w) sau se adauga la sfarsit (a, append) sirul de caractere pt modul de deschidere mai poate contine apoi: permite si celalalt mod (r w) in plus fata de cel din primul caracter deschide fisierul in mod binar (implicit: in mod text) int fclose(FiLE *stream); Scrie orice a ramas in tampoanele de date, inchide fisierul Returneaza 0 in caz de succes, EOF in caz de eroare Programarea calculatoarelor Curs 10 Marius Minea Secventa tipica de lucru cu un fisier (ex pt citire) FiLE *fp; char *name = "f txt";    sau cu nume din argv[], sau citit if (! (fp = fopen(name, "r"))) {  * trateaza eroarea *  }  else {  * lucreaza cu fisierul *  }  if (fclose(fp))  * eroare la inchidere, trateaz-o * ; La intrarea iesirea in mod text se pot petrece diverse conversii in functie de implementare (de exemplu traducere  n in  r n pt DOS) Datele citite corespund celor scrise doar daca: toate caracterele sunt tiparibile,  t sau  n;  n nu e precedat de spatii; ultimul caracter e  n => pentru orice alte situatii, deschideti fisierele in mod binar (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc acelasi indicator de pozitie => Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Programarea calculatoarelor Curs 10 Marius Minea Fisiere Cu functii echivalente celor folosite pana acum: int fputcdnt c, FiLE *stream);    scrie caracter in fisier int fgetc(FiLE *stream);    citeste caracter din fisier    gete, pute: ca si fgetc, fputc, dar sunt macrouri ( #define) int ungetc(int c, FiLE *stream);    pune caracterul c inapoi int fscanf (FiLE *stream, const char *format, int fprintf (FiLE *stream, const char *format, int fputs(const char *s, FiLE *stream);    scrie un sir int puts(const char *s);    scrie sirul si apoi  n la iesire - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga J 0J la sfarsit => citirea sigura a unei linii, fara depasire Programarea calculatoarelor Curs 10 Marius Minea #include void cat(FiLE *fi)    afiseaza un fisier { int c; while ((c = fgetc(fi)) 1= EOF) putchar(c); }  void maindnt argc, char *argv[]) { FiLE *fp; if (argc == 1) cat(stdin);    fara arg, citeste de la intrare else while (—argc > 0) {    pt fiecare argument pe rand if (!(fp = fopen(*++argv, "r"))) fprintf(stderr, "can^t open %s", *argv); else { cat(fp); fclose(fp); }  } } Programarea calculatoarelor Curs 10 Marius Minea Fisiere Fisiere void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);    != 0: ajuns la sfarsit de fisier int ferror(FiLE *stream);    != 0 la eroare pt acel fisier void exit(int status); termina executia programului cu val data Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna cu functia char *strerror(int errnum); din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s);    stdio h care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Programarea calculatoarelor Curs 10 Marius Minea Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t nmemb, FiLE *stream); size t fwrite (void *ptr, size t size, size t nmemb, FiLE *stream); citesc scriu nmemb obiecte de cate size octeti Functiile intorc obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror in C, nu exista fisiere de anumite tipuri (file of din PASCAL); putem insa defini astfel de functii pentru fiecare tip in parte: size t readint(int *pn, FiLE *stream)    intreg in format binar t return fread(pn, sizeof(int), 1, stream); }  size t writedbl(double x, FiLE *stream)    real in format binar t return fwrite(&x, sizeof (double) , 1, stream); }  Programarea calculatoarelor Curs 10 Marius Minea Fisiere 9 #include #include #define MAX 512 int filecopy(FiLE *fi, FiLE *fo) t char buf[MAX]; int size;    nr octeti cititi while (ifeof(fi)) t size = fread(buf, 1, MAX, fi); fwrite(buf, 1, size, fo);    scrie doar size octeti if (ferror(fi) || ferror(fo)) return errno; return 0; Programarea calculatoarelor Curs 10 Marius Minea Fisiere 10 void main(int arge, char *argv[]) FiLE *fi, *fo; if (arge ! = 3) { fprintf(stderr, "usage: сору source destination n"); exit(-l); } else -{ if (! (fi = fopen(argv[l], "r"))) varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);    doar cand s e bun; nu semnaleaza erori n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf(s, "%d", &n);  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu %n) *  Programarea calculatoarelor Curs 10 Marius Minea Programarea calculatoarelor Curs 10 Marius Minea Verificarea protocoalelor de securitate Nevoia de comunicare secreta: inca din antichitate la fel si descoperirea cifrurilor, inceputul criptografiei 21 decembrie 2004 Probleme de securitate: multiple aspecte: autentificare, integritate, confidentialitate, etc - modele ale protocoalelor si problemelor de securitate - exemple tipice de protocoale si atacuri - modelarea in logica BAN - metode de verificare Solutiile folosite sunt complexe si rationamentele asupra lor dificile Securitatea unui protocol nu trebuie sa se depinda de pastrarea secreta a algoritmului (NU: "security through obscurity") - Erori subtile in protocoale existente au fost descoperite uneori dupa foarte mult timp (17 ani, intr-un caz) => riscuri mari in cazul compromiterii unui algoritm slab, secret si deci neanalizat de specialisti => importanta verificarii formale cu atat mai mare Verificare formala Curs 10 Marius Minea Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 3 Verificarea protocoalelor de securitate O problema fundamentala: stabilirea unui canal sigur (criptat) de comunicatie intre doua entitati - cheie comuna cunoscuta doar de cei doi participanti - cheia de decriptare e obtinuta simplu din cea de criptare (conventional se considera aceeasi) - exemplu: Data Encryption Standard (1975) - fiecare participant A: pereche de chei - publica, Ka: criptare   secreta, Л'7* 1: decriptare - A trimite Л'[,(Л'171(Л )): decriptat doar de B, sigur de la A - ex Diffie-Hellman, Rivest-Shamir-Adleman (1976) Verificare formala Curs 10 Marius Minea [Dolev Si Yao ’83]: importanta unor prezumtii clare in modelarea, analiza si verificarea protocoalelor: 1) intr-un sistem cu chei publice: a) functiile de criptare nu se pot sparge b) directorul de chei publice e permanent integru c) fiecare are acces la toate cheile publice Ex, VA" d) numai A are acces la cheia de decriptare Dx 2) Un protocol intre doi participanti nu necesita asistenta unui al treilea pentru criptare sau decriptare 3) intr-un protocol uniform, toate perechile comunicante folosesc acelasi format pentru mesaje Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 5 Verificarea protocoalelor de securitate Protocolul 1: (1) A^B: EB(M ) (2) В A: EA(M) Atacul 1: (1) Л   B: EB(M), interceptat de Z (2) Z —1 В: E (3) В -4 Z: EZ(M); Z decodifica M Protocolul 2: (1) A r B: EB(EB(M )A) (2) В -4- A: Ea(Ea(M)B) Atacul 2: (1) Z^A-, EA(EA(EA(M)B)Z) (2) A -+ Z: Ez(Ez(Ea(M)B)A) (3) Z decodifica EA(M )B, deci are Яд(Л7) (4) Z^A- EA{EA{M)Z) (4) ,i Z: EZ(EZ(M)A), deci Z are M Sabotorii sunt "activi": ei pot asculta linia pentru a capta mesaje, si apoi fac tot posibilul pentru a le descifra: a) poate obtine orice mesaj din retea b) e un utilizator legitim al retelei, in particular poate initia o conversatie cu orice utilizator c) va avea ocazia sa receptioneze mesaje de la orice utilizator A (mai general, se presupune ca orice utilizator В poate deveni receptor pentru orice utilizator A) Verificare formala Curs 10 Marius Minea Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 7 Verificarea protocoalelor de securitate Dolev & Yao discuta doua tipuri de protocoale, definite prin operatiile permise in fiecare din ele: 1 Protocoale in cascada - criptare cu orice cheie publica - decriptare cu cheia proprie 2 Protocoale cu etichetare cu nume (name stamp) Suplimentar: - adaugarea la mesaj a unui nume de participant - stergerea numelui unui anumit participant - stergerea oricarui nume Problema corectitudinii devine o problema de rescriere pentru siruri dintr-un alfabet, decidabila in timp polinomial Dar nedecidabila pentru clase mai complexe Verificare formala Curs 10 Marius Minea protocoale prin care participantii se conving reciproc de identitatea lor si fie stabilesc (chei) secrete comune pentru comunicare, fie recunosc utilizarea cheilor secrete ale partenerilor - cele mai studiate protocoale de securitate din literatura Notatii: A,B: participant! S: server de autentificare Na,Nb' "nonce" (de la: number once) — numar aleator generat pentru a evita reutilizarea mesajelor vechi de catre un intrus mesajul X criptat cu cheia К [Needham & Schroeder ’78] "Using Encryption for Authentication in Large Networks of Computere": articol clasic Printre altele, sunt primii care au prezis importanta metodelor formale de verificare Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 9 Verificarea protocoalelor de securitate 10 (1) a-+S: A,B,Na A anunta serverului S intentia de a comunica cu В (si garanteaza prospetimea mesajului cu un "nonce" Na ) (2) S^A: S transmite lui A cheia Kab, impreuna cu un mesaj criptat pentru B, pe care A il retransmite acestuia: (3) A^B: {Kab,A}Klis В extrage cheia Kab si anunta pe A prin transmiterea unui nonce Nb: (4) В A: {Nb}Kab A confirma retransmitand un mesaj bazat pe Nb (in mod conventional, decrementat cu 1): (5) Л В: {Nb - l}Kah Acum, ambii participant! stiu ca pot comunica cu Kab [Denning & Sacco, 1981] Problema: un intrus care a urmarit o sesiune anterioara poate sa forteze pe В sa accepte o cheie veche, potential compromisa intrusul i impersoneaza pe A (notam 7(A)) si trimite lui В mesajul (3) din sesiunea anterioara, cu cheia veche A'c: (3)  (Л) ; B: {A'C,A}K(" (4) В->І(АУ- {Nb}Kr (5) 7(A) -4 B: {Nb - l}Kr Pericolul: i are timp practic nelimitat sa compromita cheia Kc Corectie: etichete de timp (timestamps) sau nonce suplimentar Verificare formala Curs 10 Marius Minea Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 11 Verificarea protocoalelor de securitate 12 [Lowe ’95] gaseste eroare in protocolul cu chei publice (dupa 17 ani!) (1) A->B: A, В, {AB, A cere comunicarea, transmite nonce Na (2) В л A: B,A,{Na,Nb}xa В raspunde cu nonce propriu Nb (3) Л- Й: A, B,{Nb}xb A confirma receptia Atac cu doua sesiuni concurente: A initiaza sesiunea a cu intrusul i; acesta impersoneaza pe A in sesiunea  3 cu В (a l) Ar!: A,i,{Na,A}K G3 1)  (Л) л B: A,B,{Xa,A}K(, (3-2) В i(A): B, A, {Na, NbyKa (a 2) i-+A: i, A, {Na, Nb}Ka (a 3) Ан-J: A,i,{Nb}Ki (33)  (Л) :-B: A,B,{Nb}Kli Descoperit: cu un model-checker (FDR) pentru limbajul CSP Corectie: includerea numelui emitatorului, criptat, in mesajul (2) Verificare formala Curs 10 Marius Minea "Cryptography is not broken, it is circumvented" - A Shamir Clark & Jacob, "A Survey of Authentication Protocol Literature, '97: • Atacuri de "prospetime" (freshness attacks) - un mesaj (sau fragment) dintr-o sesiune de comunicatie anterioara este memorat si inserat de un intrus intr-o noua sesiune • Atacuri cu erori de tip (type flaws) - Un mesaj de compus din campuri, fiecare cu o anumita interpretare (date, numar unicat, numele unui participant, valoarea unei chei) - Atacul e bazat pe acceptarea unui mesaj cu o alta interpretare (pe campuri de biti) decat cea cu care a fost transmis initial Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 13 Verificarea protocoalelor de securitate • Atacuri in sesiuni paralele - doua sau mai multe sesiuni concurente ale aceluiasi protocol - mesajele dintr-o sesiune folosite in atacul alteia • Atacuri dependente de implementare - atacurile de tip pot fi eliminate daca reprezentarea componentelor mesajului contine redundanta pt a distinge tipul - interactiunea dintre protocol si metoda de criptare (ex schimbarea unui bit in criptarea bit cu bit) • Atacuri la integritatea cheii (binding attacks) - inducerea in eroare asupra cheii publice a partenerului (inlocuirea cu cheia publica a intrusului) • si multe altele Verificare formala Curs 10 Marius Minea [Burrows, Abadi, Needham ’89: "A logic of authentication"] - cea mai importanta metoda de modelare in logica - o logica despre convingeri (logic of belief), spre deosebire de logicile despre cunoastere (logic of knowledge) - despre ceea ce crede fiecare participant ca e adevarat Scopul: de a exprima cu precizie: - prezumtiile initiale despre functionarea unui protocol - convingerile finale la care ajung participantii Exemple: - ce realizeaza (atinge) protocolul ? - necesita mai multe prezumtii decat alt protocol ? - transmite cripteaza ceva care nu e necesar ? Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 15 Verificarea protocoalelor de securitate 16 P H X P crede X P X P are Jurisdictie asupra lui X P este o autoritate in materie de X (ex o cheie) si trebuie crezut t(X) X este proaspat (nu a fost trimis pana acum) P a Q P si Q pot folosi cheia comuna К pentru a comunica a P P are cheia publica К P Q X este un secret cunoscut doar de P si Q {X}k mesajul X criptat cu cheia К (X)y X combinat cu secretul У (pentru identificare) Reguli cu privire la semnificatia mesajelor: - pentru chei comune: P|eQa P, P crede partile Proiectie: P a spus un ansamblu => a spus partile P|=A, P|=Y P H (А, У) PHQH(A,y) РН(А,У) PHA PHQHA Reguli de decriptare, de ex P Ha Q, P r(A Д B)) (o buna cheie e "proaspata", premisa explicitata aici) A H l(Na) В H г(ЛГь) S H t(A B) Din A l( Na'), si (2) deducem: A S A B, A^ S ^sf' в) iar apoi din regula de Jurisdictie: А А В A t(A B) Dupa primirea fragmentului (3) de la A, deducem: В S |  A В Nu se poate obtine В А В fara premisa В t(A Д В) (i!) Din prospetimea mesajelor (4) si (5) deducem А В A В si В A A & B, deci fiecare participant e convins atat de validitatea cheii, cat si ca acest lucru e crezut si de celalalt Rationamentul evidentiaza premisa care din cele vazute e periculoasa, permitand unui intrus sa substituie o cheie compromisa Verificare formala Curs 10 Marius Minea - permite demonstrarea unor proprietati despre protocoale - daca nu se poate demonstra: motive serioase de dubiu - poate identifica premise dubioase, neexplicitate altfel Dar: - logica monotona: un fapt existent nu poate fi retractat - nu trateaza notiunea de confidentialitate a cheilor sau compromiterea acesteia (de exemplu: transmiterea unei chei in clar) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 21 Verificarea protocoalelor de securitate 22 Se poate aplica un model checker generic, modeland intrusul si actiunile sale posibile Sau: model checker specializat, ex BRUTUS [Clarke, Marrero, Jha] Modelarea implicita a intrusului: o relatie i- prin care intrusul poate deriva mesaje m dintr-un set initial de informatii i: - daca mei atunci il-m - concatenare: daca 11- mi si 11- ni2 atunci H-mp m? - proiectie: daca 11- mi   m-2 atunci 11- mi si 11- ni2 - criptare: daca 11- m si 11- k atunci 11- {m}j - decriptare: daca 11- {m}j si 11- A"1 atunci 11- m Protocolul: compozitie asincrona intre participanti si intrus intrusul poate asculta orice, si poate sterge, modifica sau adauga mesaje cf setului sau de informatii Verificare formala Curs 10 Marius Minea Exemplu: RVChecker, REVERE [Kindred & Wing] Utilizat pentru o logica de tipul BAN extinsa Generarea de teorii (pentru anumite logici simple): - o metoda sintactica de demonstrare de teoreme bazata pe saturare - produce o reprezentare finita a unei teorii posibil infinite (toate teoremele generate din niste ipoteze si reguli) -terminarea bazata pe limitarea aplicarii regulilor de inferenta care pot genera concluzii de dimensiuni mai mari decat premisele Combinarea cu model checking: - o premisa dubioasa gasita prin generarea de teorii: folosita pentru modelarea unui atac - reciproc, un contraxemplu, modelat sub forma de deductie logica poate identifica o premisa dubioasa Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate Principalul dezavantaj pt model checking: e necesar un model finit, deci limitarea a numarului de participanti si sesiuni Demonstratoarele de teoreme nu au aceasta limitare Rationament rescriere in Prolog: interrogator [Millen’87] NRL Protocol Analyzer [Meadows et al ] - combinatie theorem-proving + model checking - porneste de la o stare de eroare (dorit inaccesibila) - cauta inapoi folosind tehnici inductive Athena [Song et al , CMU Berkeley] - reduce evaluarea unei formule la explorarea unui spatiu finit - reprezentare (strand space) bazata pe cauzalitate si nu pe executii individuale => reduce mult spatiul starilor - explorarea de stari parametrizate cu variabile libere Verificare formala Curs 10 Marius Minea Programarea calculatoarelor Curs 10 Programarea calculatoarelor Alocare dinamica Pointeri la functii Marius Minea 6 mai 2008 Folosim pentru a lucra de fapt cu indicate prin adresa declarand un pointer tip *p avem loc doar pentru o NU si pentru un (variabila) de tip Declararea lui char *s; NU inseama si loc pentru a citi memora un sir! Pana acum am indicat prin pointeri doar variabile deja declarate: int x; int *p; p = &x; char a ; char *s; s = a+5;    s = &a ; Am declarat static doar tablouri de dimensiuni cunoscute si fixe (in C99 se permit dimensiuni variabile, evaluate la rulare) Nu putem dintr-o functie un tablou: el trebuie declarat in afara functiei, si adresa transmisa la functie care Ti completeaza (ex scanf, strcpy, functiile scrise pentru lucrul cu vectori matrici) Functiile de (stdlib h) permit sa creem variabile noi de dimensiuni necesare aparute la rularea programului Marius Minea Programarea calculatoarelor Curs 10 Marius Minea Programarea calculatoarelor Alocare dinamica Pointeri la functii 3 Programarea calculatoarelor Alocare dinamica Pointeri la functii void *malloc (size t size); aloca size octeti void *calloc (size t num, size t size); num*size octeti inlt CU 0 - returneaza adresa de inceput unde a fost alocat nr dat de octeti sau null la eroare (ex mem insuficienta) =4" unei zone alocate cu c maiioc: void *reaiioc(void *ptr, size t size); modifica marimea la size - poate returna alta adresa decat ptr, atunci muta continutul existent => Ex if (pl = realloc(p, size)) {p= pl;  * apoi folosim p *  } Memoria alocata dinamic void free(void *ptr); cand nu mai e necesara elibereaza memoria alocata cu c maiioc int i, n, *t; printf("Nr de elemente ?"); scanf("%d", &n); if ((t = malloc(n * sizeof(int))) != NULL) for (i = 0; i 0) =4" foloseste argumente void * fiind compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *);  tip ptr fct cmp int intcmp(int *pl, int *p2) { return *pl - *p2; }  fct cmp intregi int tab = { -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sorteaza crescator Programarea calculatoarelor Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 6 decembrie 2004 Functiile malloc calloc realloc si tree gestioneaza memoria pentru cererile facute de programul utilizator la rulare, pornind de la totalul de memorie pus la dispozitie de sistemul de operare Probleme de rezolvat: - gasirea unui bloc de memorie de dimensiune potrivita (maiioc) - returnarea unui bloc in multimea celor disponibile (tree) - fragmentarea cat mai redusa in urma cererilor repetate - compactarea in blocuri mai mari a fragmentelor adiacente eliberate - structuri de date si algoritmi pentru implementare eficienta Programarea calculatoarelor 2 Curs 10 Marius Minea Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 3 Aplicatii implementarea alocarii dinamice - initial, un singur bloc cu intreaga memoria disponibila pt alocare (eventual poate fi crescuta prin apeluri la sistemul de operare) - din acest bloc se separa cantitatile alocate la cerere - ulterior, acestea pot fi eliberate si returnate => fragmentarea memoriei; trebuie o lista de blocuri disponibile informatia necesara pentru gestionare: - fiecare bloc contine un antet, pe langa portiunea utila, cu: lungimea blocului, si un fanion de utilizare (bit: alocat liber) -in blocurile libere (in plus): un pointer la urmatorul liber din lista (eventual doi pointeri, pentru lista dublu inlantuita) => e necesara o lungime minima a blocurilor pentru a cuprinde antetul - informatia din antet poate fi codificata pentru a ocupa spatiu minim - pentru un bloc alocat, e necesar doar bitul de alocare + dimensiunea Programarea calculatoarelor 2 Curs 10 Marius Minea - daca permitem alocarea blocurilor de orice dimensiuni, structurile de date si algoritmii devin mai complicati si ineficient! - solutia: se selecteaza un sir s2 sn de dimensiuni permise orice solicitare e rotunjita in sus la cea mai mica lungime cuprinzatoare => e suficient sa se tina minte o lista de blocuri libere pentru fiecare dimensiune permisa s, (aceasta include informatia de gestiune!) Problema: daca nu exista un bloc disponibil de dimensiune sj , trebuie fragmentat unul mai mare Pentru a nu crea blocuri de alte dimensiuni: sistemul buddy [Knuth, 1973]: si+1 = s, + (de ordinul k) - pentru k = 0: sistemul exponential: 1, 2, 4, (puterile lui 2) - pentru k = 1: sistemul Fibonacci: 1, 2, 3, 5, 8, in practica, se porneste de la o dimensiune minima a blocurilor (multipli de cuvant de memorie, ex 4, 8, 16) Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice Aplicatii implementarea alocarii dinamice Conceptual: struct block { unsigned char used; size t size; struct block *prev; struct block *next; } b;  * ocupa 16 octeti *  Optimizat prin codificare pe biti: struct block { unsigned used: 1; unsigned szhi: 2; unsigned prev: 29; unsigned szlo: 3; unsigned next: 29; }  b;  * incape pe 8 octeti *  Valoarea size = b szhi " 3 + b szio reprezinta un indice in tabela cu dimensiunile permise => pe 5 biti se pot codifica 32 de dimensiuni E natural ca blocurile sa fie aliniate la multipli de 8 octeti => pointerii (pe 32 de biti) se obtin cu: (struct block *)(b prev " 3) Transformarea intregilor in pointeri e frecventa in rutine de nivel scazut dar nu e portabila si nu se recomanda in aplicatii obisnuite Programarea calculatoarelor 2 Curs 10 Marius Minea Blocurile libere se memoreaza in cate o lista pentru fiecare dimensiune: struct block *free[NUMSiZE];  * tablou dupa nr de dimensiuni *  - cand un bloc e eliberat, testam daca poate fi recombinat cu blocul din care a fost desprins initial (daca si fragmentul adiacent e liber) - in sisteme buddy exponentiale, un bloc de dimensiune 2a' se afla la deplasamentul d = n   2a' in memoria disponibila Perechea sa (tot cu dimensiunea 2a') are adresa: d-2a', pt n impar; d + 2a' pt n par - pt sisteme buddy de ordin k > 0, gasirea perechii e mai complicata: la despartirea intregului spatiu sn cf relatiei = s, + s, j , in fiecare bloc se contorizeaza de cate ori consecutiv ein stanga ultimei separari: daca = B ; + B ; J , atunci B-pcnt = B^ cnt + 1 si B ; j cnt = 0 - la eliberare, daca Fi, mi = 0, perechea e blocul B ; | j din stanga; - daca Bt cnt 0, perechea de testat e blocul B ; j din dreapta lui Programarea calculatoarelor 2 Curs 10 Marius Minea Recursivitate 18 decembrie 2002 Recursivitatea e un concept fundamental in matematica si informatica Un obiect (o notiune) e recursiv(a) daca e folosit in propria sa definitie Exemplu din matematica: siruri recurente - progresie aritmetica: cq = a, xn = ж" і + p, pentru n > 0 - sirul lui Fibonacci: Fo = 1, Fj = 1, Fn = Fn 1 + Fn 2 pentru n > 1 Recursivitatea in limbajul C: - functii recursive: o functie f care se apeleaza pe sine insusi (direct) sau indirect, ex f apeleaza pe g, g apeleaza pe h, iar h pe f - tipuri de date recursive (tip structura cu camp pointer la acel tip) typedef struct 1 { int info;  * sau mai multe canpuri cu diverse date *  struct 1 *next;  * pointer la acelasi tip *  } list;  * definim list ca nume de tip pentru struct 1 *  Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate Recursivitate O definitie recursiva trebuie sa fie bine formata - o notiune nu se poate defini doar in functie de sine insusi ( c = x) - o definitie recursiva se poate folosi doar de notiuni deja definite NU: xn = "re-i-i - 1, pentru n > 0 => orice sir de apeluri de functii recursive trebuie sa se opreasca (nu va genera un calcul infinit) in general, distingem: - un caz de baza (pentru care notiunea e definita direct) (ex a° = 1) - un pas inductiv (recursivitatea propriu-zisa) (ex ""  i1 = ап*а) Cu principiul inductiei, demonstram P(n + 1) stiind P(i) pentru i ne asiguram ca recursivitatea se va opri la cazul de baza Recursivitatea si iteratia sunt notiuni strans legate Orice program recursiv poate fi transformat mecanic intr-unul care utilizeaza doar iteratia (pe acelasi principiu folosit de compilator la generarea de cod pentru apeluri de functii, folosind o stiva) invers, semantica unui ciclu (cu test initial) poate fi definita recursiv: while ( cond ) instructiune; if ( cond ) { instructiune; while ( cond ) instructiune; -in general, codul scris folosind doar iteratia e mai eficient - dar o solutia recursiva e adesea cea mai simpla, eleganta si naturala Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate Recursivitate int fact (int n) { if (n == 0) return 1; else return n * fact(n-l); int fact nonrec(int n) int p = 1; while (n > 0) { p = p * n; n = n - 1; return p; => transcriere simpla dintr-o varianta in alta; in cea recursiva, valoarea factorialului se acumuleaza automat in expresia returnata (in varianta recursiva, e necesara variabila p) Atentie la conditiile limita ! fact va cicla infinit pentru n = 0; { f = malloc(n * sizeof (int)); if (n = 0; f = f = 1;  * vrem 0 pt n negativ *  for (i = 2; i nr de apeluri (cate pt fib(5)?) e exponential in n (f ineficient) Obs completati fib nonrec pt a functiona corect pt n deja calculat *  else return f[n] = fib memo(n-l) + fib memo(n-2);  * memoram in f[n] inainte de a returna valoarea *  } Cate apeluri se efectueaza pentru tibunemoCs) ? Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Adesea, cazul de baza e f simplu (ex test si returnarea unei valori) in comparatie, costul unui apel de functie poate fi semnificativ => Putem trata cazul de baza fara a mai face un apel suplimentar #define MAX 100 int f [MAX+1] = {1, 1};  * restul zero *  int fib r(int n)  * pentru n >= 2 *  return f [n] = (f [n-l]?f En-1] :fib r (n-1) ) + (f [n-2] ?f [n-2] :fib r(n-2));  * testam f [k] pt a decide daca sa apelam recursiv sau nu *  int fib main(int n)  * se apeleaza de utilizator *  if (n = 0; else if (n > MAX) return -1;  * eroare *  else return fib r(n); Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 9 Recursivitate Una din principalele aplicatii ale recursivitatii: rezolvarea unei probleme prin descompunerea in subprobleme mai mici Exemplu: Sa se genereze toate sirurile de n cifre binare (in total 2n) Definitie recursiva: n-1 cifre binare, urmate de 0 sau 1 (descompunere in doua subprobleme mai mici) #define N 10 char s [N+l] ; s[N] = л 0л; bitstrings(s+N, N); void bitstrings(char *s, int n) { if (n == 0) puts(s); else { —s; *s = >0>; bitstrings(s, n-1); *s = fi*; bitstrings(s, n-1); }  * completeaza de la coada *  Exemplu: puts: tiparirea unui sir de caractere, urmat de ’ n' - pentru sirul vid (’ 0’), tipareste ’ n’ - altfel, tipareste primul caracter, tipareste restul sirului void puts(char *s) void puts(char *s) " , s r while (*s) { if (*S) { ,   s putchar(*s); putchar(*s); s = s+1; puts(s+l); }• else putchar (* nf); putchar(* n’); in cazul recursivitatii la dreapta (apelul recursiv este ultimul lucru) - transformam in bucla, cu aceeasi conditie de continuare - actualizam variabilele cu valorile argumentelor din apelul recursiv Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate Poate fi necesara rescrierea, pentru a aduce apelul recursiv la sfarsit Ex factorialul, cu parametru suplimentar produsul acumulat deja int fact prod(int n, int p) if (n > 0) { p = p * n; return fact prod(n-l, p); }• else return p;  * apelat cu fact prod(n, 1) *  int fact nonrec(int n) int p = 1; while (n > 0)  { p = p * n; n = n - 1; return p; Pentru mai mult de un apel recursiv, e necesara folosirea unei stive Utilizarea si programarea calculatoarelor Curs 10 Marius Minea 3 decembrie 2012 Un e o secventa de date (octeti) stocata pe un mediu extern Fisiere : contin caractere grupate in linii terminate cu  n fisiere txt, programe c, ,c++, pagini html, etc La prelucrare pot fi transformate dupa conventii date de sistem: de ex  r n (Windows) in loc de  n (Unix) => ceea ce se citeste poate diferi de ce s-a scris (e la fel doar daca textul contine doar caractere tiparibile, tab si  n si nu contine spatii inainte de  n) Fisiere : secvente arbitrare de octeti (nu neaparat text) fisiere executabile, doc, PDF, imagini, video audio, zip, etc Prelucrarea in format binar se face fara conversii de caractere => octetii sunt cititi exact la fel cum au fost scrisi Orice fisier (inclusiv text) poate fi deschis   prelucrat in mod binar 1 Deschiderea fisierului: functia 2 Prelucrarea: citire, scriere, pozitionare (f)getc, (f)putc, fgets, fputs, fscanf, fprintf, fread, fwrite, fseek, ftell 3 inchiderea fisierului: functia : se refera la fisier prin produce un pointer de tip (fisierul e gata de lucru) (sir, char *) spre o structura de date interna Restul functiilor de tip NU se mai refera la fisier prin nume returnat de fopen (read): deschide pentru citire (trebuie sa existe) (write): deschide pentru scriere (sters daca exista, creat altfel) (append): deschidere pentru adaugare (creat daca nu exista; altfel pozitionare la sfarsit, datele existente raman) Dupa primul caracter (r, w, a) pot urma: (ex r+, w+, a+): fisierul se deschide in modul indicat, dar poate fi folosit si in modul complementar (scriere   citire) Modul implicit e text (folosit pentru caractere tiparibile, tab,  n) : deschidere in mod binar (pentru orice alt format) : (eXclusiv) poate fi ultimul caracter din modul de deschidere fisierul nu trebuie sa existe, si nu se permite acces partajat Exemple: rb+ (citire si scriere, binar), wx, wb+x, a+x, etc arg 1: (absolut sau fata de directorul curent) arg 2: cu : r, w, sau a; optional +, b, x FiLE *fl = fopen(" home student t txt", "r");    nume fix FiLE *f2 = fopen(argv , "w");    numele: al doilea arg la cmd char nume ;    exemplu cu numele citit if (scanf ("7,31s", nume) == 1) { FiLE *f = fopen(nume, "ab+"); }    deschide in mod binar, pentru adaugare+citire fopen returneaza NULL in caz de eroare (trebuie testat ii!) Altfel, pointerul returnat (un FiLE *) e folosit in alte functii Scrie orice a ramas in tampoanele de date, inchide fisierul Returneaza 0 in caz de succes, EOF in caz de eroare in stdio h sunt definite: : fisierul standard de intrare (normal: tastatura) de aici citesc getchar, scanf : fisierul standard de iesire (normal: ecranul) aici scriu putchar, printf, puts : fisierul standard de eroare (normal: ecranul) Aceste fisiere sunt deschise automat la rularea programului E bine ca mesajele de eroare sa fie scrise la stderr, pentru a le putea separa la nevoie de scrierea rezultatelor la stdout Putem fisierele standard spre dinspre alte fisiere: intrarea: program out txt (va scrie in out txt) ambele: program out txt Cate un int fputc(int c, FiLE *stream)    scrie caracter in fisier int fgetc(FiLE *stream)    citeste caracter din fisier    gete, pute: ca si fgetc, fputc int ungetc(int c, FiLE *stream)    pune caracter c inapoi Citire scriere (la fel ca printf scanf, din fisierul indicat) int fscanf (FiLE *stream, const char *format, ) int fprintf(FiLE *stream, const char *format, ) Cate o int fputs(const char *s, FiLE *stream)    scrie un sir int puts(const char *s)    scrie sirul +  n la stdout char *fgets(char *s, int size, FiLE *stream)   citeste din fisier in tabloul s, max size caract + ’ 0’ Secventa tipica de lucru cu un fisier (exemplu pentru citire) FiLE *f = fopen( , "r");    sau "rb", "w", "a", etc if (f) {    f != NULL, s-a deschis    foloseste fisierul f if (fclose(f)) {  * eroare la inchidere *  } } else {  * trateaza eroare la deschidere *  } Exemplu cu numele fisierului dat pe linia de comanda: #include #include int main(int argc, char *argv[]) if (argc != 2) { fprintf(stderr, "folosire corecta: program numefisier n"); return 1;    sau alt cod de eroare } FiLE *fp = fopen(argv[l], "r"); if (!fp) { perror("eroare la deschidere"); return errno; }    foloseste fisierul, apoi inchide return 0; int feof (FiLE *stream) != 0: ajuns la sfarsit de fisier int ferror(FiLE *stream) != 0 daca fisierul a avut erori void clearerr(FiLE *stream) reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat variabila globala int errno declarata in errno h contine codul ultimei erori intr-o functie de biblioteca (operatie nepermisa, fisier inexistent, memorie unsuficienta, etc ) Functia void perror(const char *s) din stdio,h tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii (aceeasi ca si char *strerror(int errnum) din string h) Pana acum am folosit functii pentru citirea in mod text Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t nmemb, FiLE *strm) size t fwrite(void *ptr, size t size, size t nmemb, FiLE *strm) citesc scriu nmemb obiecte de cate size octeti Functiile intorc obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror Putem defini functii pentru a scrie citi numere in format binar int32 t readint32(FiLE *stream)    intreg pe 32 de biti { int32 t n; fread(&n, sizeof(int32 t), 1, stream); return n; } returneaza pozitia relativ la inceput Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: Pozitioneaza indicatorul de citire scriere la deplasamentul offset fata de punctul de referinta precizat prin parametrul 3: SEEK SET (inceput), SEEK CUR (punctul curent), SEEK END (sfarsit) repozitioneaza indicatorul la inceput la fel ca fseek(stream, OL, SEEK SET); clearerr(stream); Repozitionarea e utila pentru a "sari" peste o parte din fisier Trebuie folosit fseek fflush cand comutam intre citire si scriere NU e posibila pozitionarea in orice fisier! (ex stdin stdout) scrie tampoanele de date nescrise pt fisierul de iesire indicat Tipuri definite de utilizator (structuri, uniuni, enumerari) Grupeaza elemente de tipuri diferite, legate logic intre ele struct lung {    defineste tipul 'struct lung’ double val; char unit ; struct lung dl = { 60, "km" };    declara variabila initializata struct vect {    defineste tipul 'struct vect’ double x, y; } vl, v2;    si in acelasi timp declara doua variabile Elementele unei structuri se numesc (engl fields) pot fi de orice tip, dar de tip structura (nu recursiv) : cu sintaxa пите-variabila nume-camp punctul e (e un operator postfix) struct vect pl; pl x=2; pl y=3; printf ("° of 70f n", pl x, pl y); struct student { char nume ; char *domiciliu; } s;    numele complet de tip (inel, "struct")    tablou alocat cu numar fix de caractere    doar ADRESA, nu aloca si memoria pt sir    declara var s de tip struct student intr-un camp tablou de caractere poate fi copiata direct o valoare strcpy(s nume, "Stefanovici");    NU atribuire, e tablou Un camp si poate fi atribuit cu alt sir: s domiciliu = "str Linistei nr 2"; Daca sursa e un tablou careisi schimba valoarea, facem o copie a sirului, alocata dinamic: s domiciliu = strdup(buf); (daca apoi in buf se citeste altceva) 1Т 1Т Numele campurilor se vad doar in interiorul structurii nu putem folosi doar numele campului, doar numevar camp tipuri structuri diferite pot avea campuri numite la fel Structurile fi atribuite in totalitatea lor struct vect vl = {2, 3}, v2; v2 = vl; Structurile fi transmise catre   returnate de functii (cand sunt mari, se prefera transmiterea   returnarea de pointeri) struct vect add(struct vect vl, struct vect v2) struct vect v; v x = vl x + v2 x; v y = vl y + v2 y; return v; Putem scrie de tip structura indicand tipul intre ( ) struct vect vl; vl = (struct vect){-4, 5}; structuri cu operatori logici => trebuie comparate camp cu camp: if (vl x==v2 x && vl y==v2 y) Putem da noi nume la tipuri existente (mai expresive; mai scurte) Forma generala: typedef nume-tip-existent Ex typedef double ; typedef struct vect ; typedef int (* )(const void *, const void *); (ca declaratia de variabile + typedef in fata => declara un ) Numele nou se poate da direct in definirea tipului: typedef struct student {  * ceva campuri *  } student t; putem omite eticheta dupa struct (folosim apoi doar numele nou) typedef struct {  * ceva campuri *  } student t; sau definim intai tipul structura si apoi sinonimul pentru el struct student {  * ceva campuri *  };    defineste tipul typedef struct student student t;    defineste sinonimul Putem accesa campurile cu ajutorul unui pointer la structura: struct student *p, s; p = &s; (*p),nota dipl = 9 50; Operatorul e echivalent cu indirectarea urmata de selectie: pointer->numecamp echivalent cu (*pointer) numecamp Operatorii si -> au , ca si () si П Atentie la ordinea de evaluare i p->x++ inseamna (p->x)++ (-> e prioritar) ++p->x inseamna ++(p->x) (-> e prioritar) *p->x inseamna *(p->x) (-> e prioritar) *p->s++ inseamna *((p->s)++) (++e prioritar lui *) in C, tipurile agregat (compuse) pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : doua tablouri de aceias indici, folosite impreuna => inlocuim cu un tablou de element structura: char* nume luna = { "ianuarie",  * , *  "decembrie" }; char zile luna = { 31, 28, 31, 30,  * , *  30, 31 };    e preferabila varianta urmatoare struct luna { char *nume; int zile; }; struct luna luni = {{"ianuarie",31}, , {"decembrie",31}}; Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinital) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {    struct wl e un tip, incomplet definit char *word;    cuvantul: informatia propriu-zisa struct wl *next;    pointer la structura de acelasi tip    acum definitia tipului e completa Un arbore binar, avand in noduri numere intregi: typedef struct t tree;    def tipul incomplet tree = struct t struct t { int val; tree *left, *right;    foloseste numele din typedef    aici tipul struct t e complet si echivalent cu t Vrem sa reprezentam mai multe informatii cat mai compact pe biti Ex data=intreg pe 32 de biti: sec, min (0-59): 6 biti, ora (0-23), ziua (1-31): 5 biti, luna (1-12): 4 biti), an (1970 + 0-63): 6 biti struct date t {    structura cu campuri pe biti unsigned sec, min : 6;    indica numarul de biti unsigned bour, day: 5;    se permit tipuri intregi unsigned month: 4; unsigned year: 6; } data = {0, 0, 17, 19, 5, 39    17:00:00, 19 05 (1970+39) Putem scrie direct: printf ("° ou 70u n" , data day, data month); Putem avea campuri fara nume: int: 2;    pe 2 biti sau forta trecerea la memorarea in octetul urmator int: 0; : da nume unui sir de valori numerice folosit cand e mai sugestiv de scris un nume decat un numar luni sc {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; defineste tipul enum luni sc ( e parte din nume i) implicit, sirul valorilor e crescator incepand cu 0 Putem specifica si explicit valori (si o valoare se poate repeta) Un tip enumerare e un tip intreg variabilele valorile enumerare se folosesc ca si intregi enum {D, L, Ma, Mc, J, V, S} zi;    tip anonim+variabila zi int nr ore lucru ;    numar de ore pe zi for (zi = L; zi pentru orice alte situatii, deschideti fisierele in mod binar (asigura corespondenta exacta intre continutul scris si citit) Citirea si scrierea intr-un fisier folosesc acelasi indicator de pozitie => Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Programarea calculatoarelor Curs 10 Marius Minea Fisiere 5 Cu functii echivalente celor folosite pana acum: int fputc(int c, FiLE *stream);    scrie caracter in fisier int fgetc(FiLE *stream);    citeste caracter din fisier    gete, pute: ca si fgetc, fputc, dar sunt macrouri ( #define) int ungetc(int c, FiLE *stream);    pune caracterul c inapoi int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);    scrie un sir int puts(const char *s);    scrie sirul si apoi  n la iesire - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ 0’ la sfarsit => citirea sigura a unei linii, fara depasire Programarea calculatoarelor Curs 10 Marius Minea Fisiere б #include void cat(FiLE *fi)    afiseaza un fisier { int c; while ((c = fgetc(fi)) != EOF) putchar(c); } void main(int argc, char *argv[]) { FiLE *fp; if (argc == 1) cat(stdin);    fara arg, citeste de la intrare else while (—argc > 0) {    pt fiecare argument pe rand if (!(fp = fopen(*++argv, "r"))) fprintf (stderr, "can’t open ° os", *argv) ; else { cat(fp); fclose(fp); } Programarea calculatoarelor Curs 10 Marius Minea void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);    != 0: ajuns la sfarsit de fisier int ferror(FiLE *stream);    != 0 la eroare pt acel fisier void exit(int status); termina executia programului cu val data Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum) ; din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s);    stdio h care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii Programarea calculatoarelor Curs 10 Marius Minea Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie direct un numar dat de octeti, neinterpretati: size t fread(void *ptr, size t size, size t nmemb, FiLE *stream); size t fwrite(void *ptr, size t size, size t nmemb, FiLE *stream); citesc scriu nmemb obiecte de cate size octeti Functiile intorc obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror in C, nu exista fisiere de anumite tipuri (file of din PASCAL); putem insa defini astfel de functii pentru fiecare tip in parte: size t readint(int *pn, FiLE *stream)    intreg { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)    real { return fwrite(&x, sizeof(double), 1, stream); in format binar in format binar Programarea calculatoarelor Curs 10 Marius Minea Fisiere 9 #include #include #define MAX 512 int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;    nr octeti cititi while (!feof(fi)) { size = fread(buf, 1, MAX, fi); fwrite(buf, 1, size, fo);    scrie doar size octeti if (ferror(fi) || ferror(fo)) return errno; return 0; Programarea calculatoarelor Curs 10 Marius Minea Fisiere 10 void main(int arge, char *argv[]) FiLE *fi, *fo; if (arge != 3) { fprintf(stderr, "usage: сору source destination n"); exit(-l); } else { if (! (fi = fopen(argv , "r"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (!(fo = fopen(argv , "w"))) { fprintf (stderr, "70s: can’t open ° os: ", argv , argv ); perror(NULL); exit(errno); if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) | fclose(fo)) perror("Eroare la inchidere"); Programarea calculatoarelor Curs 10 Marius Minea Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long ftell(FiLE *stream);    pozitia de la inceputul fisierului int fseek(FiLE *stream, long offset, int whence);    pozitionare Al treilea parametru: punctul de referinta pt pozitionarea cu offset: seek set (inceput), seek cur (punctul curent), SEEK END (sfarsit) void rewind(FiLE *stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflush(FiLE *stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Programarea calculatoarelor Curs 10 Marius Minea Fisiere 12 Functiile de tipul printf scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);    doar cand s e bun; nu semnaleaza erori n = strtol(s, &end, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf (s, "° od", &n) ;  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu ° on) *  Programarea calculatoarelor Curs 10 Marius Minea 21 decembrie 2004 - modele ale protocoalelor si problemelor de securitate - exemple tipice de protocoale si atacuri - modelarea in logica BAN - metode de verificare Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 2 Nevoia de comunicare secreta: inca din antichitate la fel si descoperirea cifrurilor, inceputul criptografiei Probleme de securitate: multiple aspecte: autentificare, integritate, confidentialitate, etc Solutiile folosite sunt complexe si rationamentele asupra lor dificile Securitatea unui protocol nu trebuie sa se depinda de pastrarea secreta a algoritmului (NU: "security through obscurity") - Erori subtile in protocoale existente au fost descoperite uneori dupa foarte mult timp (17 ani, intr-un caz) => riscuri mari in cazul compromiterii unui algoritm slab, secret si deci neanalizat de specialisti => importanta verificarii formale cu atat mai mare Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 3 O problema fundamentala: stabilirea unui canal sigur (criptat) de comunicatie intre doua entitati - cheie comuna cunoscuta doar de cei doi participant! - cheia de decriptare e obtinuta simplu din cea de criptare (conventional se considera aceeasi) - exemplu: Data Encryption Standard (1975) - fiecare participant A: pereche de chei - publica, Ka criptare   secreta, K r: decriptare - A trimite (муу decriptat doar de B, sigur de la A - ex Diffie-Hellman, Rivest-Shamir-Adleman (1976) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 4 [Dolev & Yao ’83]: importanta unor prezumtii clare in modelarea, analiza si verificarea protocoalelor: 1) intr-un sistem cu chei publice: a) functiile de criptare nu se pot sparge b) directorul de chei publice e permanent integru c) fiecare are acces la toate cheile publice Ex, VX d) numai X are acces la cheia de decriptare Dx 2) Un protocol intre doi participanti nu necesita asistenta unui al treilea pentru criptare sau decriptare 3) intr-un protocol uniform, toate perechile comunicante folosesc acelasi format pentru mesaje Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 5 Protocolul 1: (1) A^B- EB(M) (2) В A: EA(M) Atacul 1: (1) A B: EB(M), interceptat de Z (2) Z^B: BB(M) (3) В Z  Ez(My, Z decodifica M Atacul 2: Protocolul 2: (1) А -+ B: EB(EB(M)A) (2) В A: EA(EA(M)B) (1) Z A: Ea(Ea(Ea(M)B)Z) (2) A Z: Ez(Ez(Ea(M)B)A) (3) Z decodifica EA(M )B, deci are (4) Z A: EA(EA(M)Z) (4) A Z: EZ(EZ(M)A), deci Z are M Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 6 Sabotorii sunt "activi": ei pot asculta linia pentru a capta mesaje, si apoi fac tot posibilul pentru a le descifra: a) poate obtine orice mesaj din retea b) e un utilizator legitim al retelei, in particular poate initia o conversatie cu orice utilizator c) va avea ocazia sa receptioneze mesaje de la orice utilizator A (mai general, se presupune ca orice utilizator В poate deveni receptor pentru orice utilizator A) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 7 Dolev & Yao discuta doua tipuri de protocoale, definite prin operatiile permise in fiecare din ele: 1 Protocoale in cascada - criptare cu orice cheie publica - decriptare cu cheia proprie 2 Protocoale cu etichetare cu nume (name stamp) Suplimentar: - adaugarea la mesaj a unui nume de participant - stergerea numelui unui anumit participant - stergerea oricarui nume Problema corectitudinii devine o problema de rescriere pentru siruri dintr-un alfabet, decidabila in timp polinomial Dar nedecidabila pentru clase mai complexe Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 8 protocoale prin care participantii se conving reciproc de identitatea lor si fie stabilesc (chei) secrete comune pentru comunicare, fie recunosc utilizarea cheilor secrete ale partenerilor - cele mai studiate protocoale de securitate din literatura Notatii: A,B: participanti S: server de autentificare Na,Nb: "nonce" (de la: number once) = numar aleator generat pentru a evita reutilizarea mesajelor vechi de catre un intrus {X}K: mesajul X criptat cu cheia К [Needham & Schroeder ’78] "Using Encryption for Authentication in Large Networks of Computers": articol clasic Printre altele, sunt primii care au prezis importanta metodelor formale de verificare Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 9 (1) A S: A,B,Na A anunta serverului S intentia de a comunica cu В (si garanteaza prospetimea mesajului cu un "nonce" Na) (2) s A: {Na,B,Kab,{Kab,A}Kbs}Kas S transmite lui A cheia Kab, impreuna cu un mesaj criptat pentru B, pe care A il retransmite acestuia: (3) A ^B- {Kab, A}Kbs В extrage cheia Kab si anunta pe A prin transmiterea unui nonce Nb: (4) В - A: {Nb}Kab A confirma retransmitand un mesaj bazat pe Nb (in mod conventional, decrementat cu 1): W-l)Kal Acum, ambii participanti stiu ca pot comunica cu Kab Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 10 [Denning & Sacco, 1981] Problema: un intrus care a urmarit o sesiune anterioara poate sa forteze pe В sa accepte o cheie veche, potential compromisa intrusul i impersoneaza pe A (notam Z(A)) si trimite lui В mesajul (3) din sesiunea anterioara, cu cheia veche Kc' (3)  (A) ^B- {Kc,A}Kbs (4) {Nb}Kc (5) {Nb-l}Kc Pericolul: i are timp practic nelimitat sa compromita cheia Kc Corectie: etichete de timp (timestamps) sau nonce suplimentar Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 11 [Lowe ’95] gaseste eroare in protocolul cu chei publice (dupa 17 ani!) (1) А —> В: A, B, {Na, А}к, A cere comunicarea, transmite nonce Na (2) В A: B,A,{Na,Nb}Ka В raspunde cu nonce propriu Nb (3) A^B: A B {Nb}^, A confirma receptia Atac cu doua sesiuni concurente: A initiaza sesiunea a cu intrusul  ; acesta impersoneaza pe A in sesiunea  3 cu В (a l) A A,i,{Na,A}K ( 3 1) 7(A)^B: A,B,{Na,A}Kb ( 3 2) B^ (A): B,A,{Na,Nb}Ka (a 2) i —> A: i, A, {Na, Nb}Ka (a 3) A^i: А, i, {Nb}K) ( 3 3) i(A)^B: A,B,{Nb}Kb Descoperit: cu un model-checker (FDR) pentru limbajul CSP Corectie: includerea numelui emitatorului, criptat, in mesajul (2) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 12 "Cryptography is not broken, it is circumventecT - A Shamir Clark & Jacob, "A Survey of Authentication Protocol Literature, ’97: • Atacuri de "prospetime" (freshness attacks) - un mesaj (sau fragment) dintr-o sesiune de comunicatie anterioara este memorat si inserat de un intrus intr-o noua sesiune • Atacuri cu erori de tip (type flaws) - Un mesaj de compus din campuri, fiecare cu o anumita interpretare (date, numar unicat, numele unui participant, valoarea unei chei) - Atacul e bazat pe acceptarea unui mesaj cu o alta interpretare (pe campuri de biti) decat cea cu care a fost transmis initial Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 13 • Atacuri in sesiuni paralele - doua sau mai multe sesiuni concurente ale aceluiasi protocol - mesajele dintr-o sesiune folosite in atacul alteia • Atacuri dependente de implementare - atacurile de tip pot fi eliminate daca reprezentarea componentelor mesajului contine redundanta pt a distinge tipul - interactiunea dintre protocol si metoda de criptare (ex schimbarea unui bit in criptarea bit cu bit) • Atacuri la integritatea cheii (binding attacks) - inducerea in eroare asupra cheii publice a partenerului (inlocuirea cu cheia publica a intrusului) • si multe altele Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 14 [Burrows, Abadi, Needham '89: "A logic of authentication"] - cea mai importanta metoda de modelare in logica - o logica despre convingeri (logic of belief), spre deosebire de logicile despre cunoastere (logic of knowledge) - despre ceea ce crede fiecare participant ca e adevarat Scopul: de a exprima cu precizie: - prezumtiile initiale despre functionarea unui protocol - convingerile finale la care ajung participantii Exemple: - ce realizeaza (atinge) protocolul ? - necesita mai multe prezumtii decat alt protocol ? - transmite cripteaza ceva care nu e necesar ? Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 15 HQO {x}K Wy P crede X P vede (primeste, citeste) mesajul X P a spus (transmis) X candva in trecut P are jurisdictie asupra lui X P este o autoritate in materie de X (ex o cheie) si trebuie crezut X este proaspat (nu a fost trimis pana acum) P si Q pot folosi cheia comuna К pentru a comunica P are cheia publica К X este un secret cunoscut doar de P si Q mesajul X criptat cu cheia К X combinat cu secretul Y (pentru identificare) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 16 Reguli cu privire la semnificatia mesajelor: - pentru chei comune: - pentru chei publice: P^Q, РЩХ}^ - pentru secrete comune P^Q^P, P a spus partile Reguli de decriptare, de ex Bidirectionalitatea cheilor si secretelor intre participanti: Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 18 (1) A S: A,B,Na (2) S A: {Na, В, Kab, {Kab, A}Kbs}Kas (3) A^B- {Kab, A}Kbs (4) В А: {Nb}Kab (5) А-В; Ж-ПкаЬ idealizam protocolul: in loc de mesaje de biti, transmitem formule logice, corespunzatoare semnificatiei mesajelor: (1) Mesajul 1 e doar o solicitare, nu are valoare logica (2) S - A; {Na, В, (А B  H(A В), {А B}Kbs}Kas (3) A - В: {А КЛЬ B}Kbs (4) В A: {Nb, (А КЛЬ B}}Kab de la В (5) A B: {Nb, (А КЛЬ B}}Kab de la A Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securtate 19 Pornim de la premisele (abreviem F, Q |= X pt P X si Q |= X): A H (S H ttC-4 A B)) (o buna cheie e "proaspata", premisa explicitata aici) A |= Й(Ха) в |= Й(О S |= Й(А КЛЬ В) Din А |ее H(AU, si (2) deducem: A |ee S |= А Ъь В, A |= S |= ft(A Ъь В) iar apoi din regula de jurisdictie: А |= А В A |= (j(A B) Dupa primirea fragmentului (3) de la A, deducem: В |= S |  А В Nu se poate obtine В |= А В fara premisa В |= (j(A Д B) (!!) Din prospetimea mesajelor (4) si (5) deducem А |= В |= А В si В |= A |= A B, deci fiecare participant e convins atat de validitatea cheii, cat si ca acest lucru e crezut si de celalalt Rationamentul evidentiaza premisa care din cele vazute e periculoasa, permitand unui intrus sa substituie o cheie compromisa Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 20 - permite demonstrarea unor proprietati despre protocoale - daca nu se poate demonstra: motive serioase de dubiu - poate identifica premise dubioase, neexplicitate altfel Dar: - logica monotona: un fapt existent nu poate fi retractat - nu trateaza notiunea de confidentialitate a cheilor sau compromiterea acesteia (de exemplu: transmiterea unei chei in clar) Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 21 Se poate aplica un model checker generic, modeland intrusul si actiunile sale posibile Sau: model checker specializat, ex BRUTUS [Clarke, Marrero, Jha] Modelarea implicita a intrusului: o relatie H prin care intrusul poate deriva mesaje m dintr-un set initial de informatii Г - daca m e i atunci i H m - concatenare: daca i H mi si i H rri2 atunci i H mi • m2 - proiectie: daca i H mi • m2 atunci i H mi si i H rri2 - criptare: daca   hm si i H к atunci i H {m}k - decriptare: daca i H {m}k si i H k r atunci i H m Protocolul: compozitie asincrona intre participanti si intrus intrusul poate asculta orice, si poate sterge, modifica sau adauga mesaje cf setului sau de informatii Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 22 Exemplu: RVChecker, REVERE [Kindred & Wing] Utilizat pentru o logica de tipul BAN extinsa Generarea de teorii (pentru anumite logici simple): - o metoda sintactica de demonstrare de teoreme bazata pe saturare - produce o reprezentare finita a unei teorii posibil infinite (toate teoremele generate din niste ipoteze si reguli) -terminarea bazata pe limitarea aplicarii regulilor de inferenta care pot genera concluzii de dimensiuni mai mari decat premisele Combinarea cu model checking: - o premisa dubioasa gasita prin generarea de teorii: folosita pentru modelarea unui atac - reciproc, un contraxemplu, modelat sub forma de deductie logica poate identifica o premisa dubioasa Verificare formala Curs 10 Marius Minea Verificarea protocoalelor de securitate 23 Principalul dezavantaj pt model checking: e necesar un model finit, deci limitarea a numarului de participanti si sesiuni Demonstratoarele de teoreme nu au aceasta limitare Rationament rescriere in Prolog: interrogator [Millen’87] NRL Protocol Analyzer [Meadows et aL] - combinatie theorem-proving + model checking - porneste de la o stare de eroare (dorit inaccesibila) - cauta inapoi folosind tehnici inductive Athena [Song et aL, CMU Berkeley] - reduce evaluarea unei formule la explorarea unui spatiu finit - reprezentare (strand space) bazata pe cauzalitate si nu pe executii individuale => reduce mult spatiul starilor - explorarea de stari parametrizate cu variabile libere Verificare formala Curs 10 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  28 noiembrie 2016 (utilizator): introdu fisa, apasa buton (automat): toarna cafea Dupa o actiune buton fisa fisa buton fisa a avut un efect ceva ? nu nu imediat da : automatul a trecut in alta (se la actiunea buton) fisa fisa buton buton da doua cafele ? daca da, cate fise poate tine minte ? una sau mai multe, dar practic un numar important in practica: cu diverse : corespunde specificatiei? Putem structura automatului (din comportament) Comentariu C: incadrat intre si sau toata linia dupa Sursa nu are voie sa se termine inauntrul unui comentariu Cum un comentariu ? Cum daca sa o sursa corecta ? Trebuie sa unde ne aflam in prelucrare ( ) caracterele "interesante" la care reactionam depind de stare: in afara comentariului inauntrul comentariului asteptand un posibil inceput de comentariu (dupa ) asteptand un posibil sfarsit de comentariu (dupa ) programul daca in final, suntem in afara comentariului altfel (nu acceptam) programul Nu toate regulile de sintaxa pot fi descrise prin automate in general, se folosesc (cursul urmator) Dupa un sir cu numar Dupa un sir cu numar => automatul poate incepe in so cand primeste 1, schimba starea cand primeste O, sta pe loc , automatul va fi in , automatul va fi in cele doua feluri de siruri Daca ne trebuie un numar par de 1, marcam sp ca : doar daca automatul se opreste in stare acceptoare => automatul defineste o , adica un Fie un E: o multime de (ex caractere) Un finit peste alfabetul E e un sir de simboluri din E 3132 • • • 3n 3j G E Notam cu E* multimea tuturor cuvintelor peste alfabetul E E* = {зіз2 зп i 3i G E} * steaua Kleene: repetitie (zero sau mai multe aparitii) (in , vezi ulterior) important: E* are cuvinte de lungime , dar nu infinite Un  eo submultime   С E*, definita dupa anumite gramatici, automate, expresii regulate, etc limbajul sirurilor de paranteze echibrate; al sirurilor palindrom; al sirurilor de 0 si 1 care nu au trei 0 consecutivi; etc intr-un automat trebuie sa definim starile, trecerile dintr-o stare in alta (tranzitiile), starea initiala, si unde dorim sa ajungem Automat finit determinist: o multime de o , si in functie de (unele acceptoare), de intrare Un automat finit e un tuplu cu 5 elemente (cvintuplu) (E, S, sq, 6, F) E e un finit nevid de S e o multime finita nevida de de intrare {a,0,1, } sq g S e O a 6 : S x E —> S e vJ (pentru fiecare stare si intrare, da starea urmatoare) F C S e multimea starilor O (unde dorim sa ajungem) automat de paritate: accepta siruri de 0 si 1 cu numar par de 1 0 0 0 1 sau ca tabela de tranzitii sq so Si si Si So acceptoare CD in acelasi timp sq e stare initiala automat care accepta cuvinte cu oricati de b (inel 0) intre doi a b ca 6 sa fie definita peste tot e necesara inca o stare err uneori in practica se omite b a, b Notam e G E* cuvantul (fara niciun simbol) Definim inductiv o functie de tranzitie 6* cu intrari in ce stare ajunge automatul pentru un cuvant dat la intrare? pentru orice stare s G S: 6*(s,e) = s cuvant vid: nu face nimic 5*(s, 3132 зп) = 5*(5(s, 3i), 32 зп) pentru n > 0 Altfel spus, 5*(sp, З1З2 зп) = 5*(si, 32 зп) cu si = 5(so, 3i) obtinem starea si dupa intrarea 3i, si aplicam 6* pe sirul ramas Automatul (cuvantul cuvantul w G E* daca si numai daca 5*(sp, w) G F automatul intr-o stare ) Matrice S x E cu elemente din S (pentru fiecare stare si intrare, starea urmatoare) reprezinta fiecare combinatie 0 1 So So Si Si Si So Sau: un dictionar care da pentru fiecare stare functia de tranzitie reprezentata tot ca un (intrare, stare) Daca dintr-o stare multe simboluri duc in aceeasi stare urmatoare, asociem fiecarei stari: un dictionar (intrare, stare) o stare urmatoare implicita (pentru celelalte intrari) numite si (engl transducer) scopul: genereaza raspunsuri iesiri; nu au multime acceptoare F in plus: un fi si o g automate de tip iesirea e functie de : g : S - > fi automate de tip iesirea e functie de si g : S x E —> fi folosite pentru a modela Un limbaj recunoscut de un automat se numeste vom vedea ca se poate exprima prin Automatul pentru a doua limbaje П  2 (numit uzual automatul produs) tranzitioneaza accepta daca in ambele automate accepta: Automatul pentru tranzitioneaza accepta daca a doua limbaje U  2 in ambele automate (ca mai sus accepta Automatul pentru   accepta daca automatul original nu accepta in abc Exemplu: toate sirurile de a, b, c care se a, b, c Din so, primind , automatul poate - incerca sa vada daca vor mai fi exact 3 simboluri (trece in si) - ramane in sp (prespunand ca urmeaza mai mult de 3) => automatul poate urma cai Un NFA accepta daca o alegere ducand in stare acceptoare Functia de tranzitie e acum da o Avantaje: uneori se scrie mai usor (permite sa "ghicim" tranzitia buna) cand un sistem, permite o alegere la implementare Fie un NFA M = (E, S, so, 6, F) Construim un DFA echivalent Retinem la orice pas in care s-ar putea afla M => noua multime de stari va fi in cel mai rau caz, poate fi exponential in dimensiunea initiala |P(S)| = 2lsl Obtinem M' = (E, S', so, 5', F1) cu S' = P(S) У(д, a) = 5(s, a) (pentru fiecare stare s G q cu q G P(S), reunim multimile starilor in care se ajunge pe simbolul a) F' = {s G S' | s П F ф 0} (multimea starilor care au o stare acceptoare din F) a, b, с Cand obtinem o noua multime adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} a, b, с Cand obtinem o noua multime adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} a, b, с Cand obtinem o noua multime adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} a, b, с Cand obtinem o noua multime adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} {0,3} {0,1} {0} {0} a, b, с Cand obtinem o noua multime adaugam o linie la tabel Scriem tabelul de tranzitie cu multimea starilor in care se trece pe fiecare simbol a b c {0} {0} {0} {0,1} {0,1} {0} {0,2} {0,1} {0} {0,3} {0,1} {0} {0} Fiecare multime obtinuta devine o stare in DFA-ul rezultat Starile acceptoare sunt cele care contin o stare acceptoare din automatul initial 2 3 4 5 6 7 8 {1} stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal а d 2 3 4 5 б 7 | 8 | stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} а d 4 7 2 5 8 3 6 1 stare initiala: stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} а d {23,6,8} 2 3 4 5 б 7 | 8 | stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} {1,3,5,7} а d {23,6,8} {23,6,8} {13,5,7,9} 2 3 4 5 6 7 8 stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} {1,3,5,7} {2,4,6,8} а d {23,6,8} {23,6,8} {13,5,7,9} {23,6,8} 2 3 4 5 6 7 8 stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal {1} {2,4} {5} {1,3,5,7} {2,4,6,8} {1,3,7,9} а d {23,6,8} {23,6,8} {13,5,7,9} {23,6,8} {23,6,8} {5} 2 3 4 5 6 7 8 stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal a d {1} {2,4} {5} {2,4, 6, 8} {1,3,5,7} {2,4, 6, 8} {1,3,5,7,9} {2,4,6,8} {2,4,6,8} {1,3,7,9} {2,4, 6, 8} {5} {1,3,5,7,9} {2,4, 6, 8} {1,3,5,7,9} 2 3 4 5 6 7 8 stare initiala: 1 stare finala: 9 E = {a,d} a: muta adiacent d: muta diagonal a d {1} {2,4} {5} {2,4, 6, 8} {1,3,5,7} {2,4, 6, 8} {1,3,5,7,9} {2,4,6,8} {2,4,6,8} {1,3,7,9} {2,4, 6, 8} {5} {1,3,5,7,9} {2,4, 6, 8} {1,3,5,7,9} 17 = {1,3,5,7} 28 = {2,4,6,8} x5 = {1,3,7,9} 19 = {1,3,5,7,9} Un limbaj = o multime de cuvinte peste un alfabet Adesea suntem interesati in cuvinte cu structura simpla: un intreg: o secventa de cifre, eventual cu semn un real: parte intreaga + parte zecimala (una din ele optionala), exponent optional un identificator: litere, cifre, incepand cu litera sau fisiere cu numele 01-titlu mp3, 02-a tt t u mp3, Unele limbaje pot fi recunoscute eficient de dar scrierea automatului ia efort => se poate face mai simplu ? limbajelor regulate sunt limbaje regulate Mai putem defini: limbajelor Li • L2 = {W1W2 | и i G  -i, и 2 G  -2} (repetitia) L* = {w i 3n G N w = И 1И 2 • • • wn, Wj G L} nu repetitia aceluiasi sir, ci concatenarea siruri luand n = 0, rezulta e G L* pentru orice L ф 0 reprezinta (niciun simbol, lungime 0) O expresie regulata descrie un limbaj (regulat) O expresie regulata peste un alfabet E e fie: 3 cazuri de baza: 0 limbajul vid e denota limbajul {e} (cu sirul vid) a denota limbajul {a} cu a G E 3 cazuri recursive: date еі,ег expresii regulate, si urmatoarele sunt: (ei + ег) reuniunea limbajelor in practica, notata adesea еі|ег (alternativa, "sau") (ei • 62) concatenarea limbajelor ej inchiderea Kleene a limbajului Omitem paranteze cand sunt clare din relatiile de precedenta cel mai prioritar: *, apoi concatenare si apoi reuniune + punctul pentru concatenare se omite in practica se mai folosesc abrevierile e? pentru e + e (e, optional) e+ pentru e*   e (e, cel putin o data) (0 + 1)* multimea tuturor sirurilor din 0 sau 1 (0 + l)*0 ca mai sus, incheiat cu 0 (numere pare in binar) 1(0 + 1)* + 0 numere binare, fara zerouri initiale inutile Construim prin inductie structurala Pentru cazurile de baza nu are stare acceptoare starea initiala e acceptoare accepta simbolul a in celelalte trei cazuri, automatele limbajelor date rezulta un automat finit nedeterminist cu tranzitiie Constructia pentru reuniune Constructia pentru inchiderea Kleene Constructia pentru concatenare in general, nu putem contopi Sfi si s 2: ajunsi in Sfi nu avem voie sa revenim in ei insa constructiile de pana acum asigura: o unica stare initiala, in care nu se revine o unica stare acceptoare, din care nu ies tranzitii Atunci putem contopi la concatenare capetele lui ei si 62 Fie expresia (0+10)*(l+e) Construim (comasand pasii triviali): e O se face spontan, fara a consuma un simbol de intrare => ajuns intr-o stare s, e ca si ajuns in orice stare s' legata de s doar prin e-tranzitii ( a relatiei definite de e) Deci, aflat in 0, e ca si cum s-ar afla in 1, 2, 4, 8 sau 9 Aflat in 7, e ca si cum s-ar afla in 1, 2, 4, 8, 9 Liniile 1, 2 si 4 au destinatii identice =^- starile sunt echivalente => automat cu doar doua stari (ignorand starea de eroare 0) Daca sunt mai multe noduri acceptoare, adaugam un nod acceptor unic (cu tranzitii e spre el) Eliminam pe rand fiecare nod in afara de cel initial si acceptor: pentru orice nod intermediar  ' de eliminat pentru orice pereche (s, d) adauga la muchia s —> d limbajul LsjL^Ljd siruri de O si 1 care nu au doi 1 consecutivi pe 1, trece in stare cu tranzitie doar pe 0 Ambele stari sunt acceptoare => adaugam o unica stare acceptoare Eliminam 1: 0^0 0 f Obtinem astfel limbajul (0+10)*(l+e) Doua stari si si pot fi daca exista un cuvant w care dintr-una din stari conduce la o stare acceptoare, si din cealalta, nu 5*(si, w) G F ф 5*(s2, w) g F Doua stari care nu pot fi deosebite sunt => pot fi inlocuite cu o singura stare Un DFA e daca nu exista un automat cu mai putine stari care accepta acelasi limbaj Diversi (ex Hopcroft-Ullman, Moore) initial, partitie cu 2 blocuri: F, S   F (stari acceptoare sau nu) (o impartire in potentiale clase de echivalenta) desparte un bloc din partitie daca pe un simbol, starile nu trec toate in acelasi bloc din partitie (pot fi deosebite) Cuvinte din a, b cu subsir aba', "ghicim" cand incepe subsirul dorit a b 0 01 0 01 01 02 02 013 0 013 023 013 03 013 03 a,b a,b Starile care contin 3 (stare acceptoare) sunt Aici, ele trec tot timpul in stari acceptoare, deci sunt (caz simplu), si le putem comasa intr-o singura stare (numita 3) b a a a, b Un automat determinist defineste un acceptat Un astfel de limbaj se numeste El poate fi exprimat si printr-o intersectia, reuniunea, si complementarea limbajelor regulate produc limbaje regulate (deci pot fi recunoscute de automate finite) Automatele finite nedeterministe se pot transforma in deterministe (deci recunosc tot limbaje regulate) dar numarul de stari poate creste exponential Automatele finite pot fi , comasand Automatele deterministe si nedeterministe si expresiile regulate au aceeasi putere expresiva (descriu limbaje regulate) 5 decembrie 2011 Grupeaza elemente de tipuri diferite, legate logic intre ele struct lung {    defineste tipul 'struct lung’ double val; char unit ; } vl;   si declara o variabila de acel tip struct lung v2 = { 60, "km" }, v3;    v2 initializat, v3 nu struct vect { double x, y;    declara tipul struct vect, nu si variabile Elementele unei structuri se numesc (engl fields) pot fi de orice tip, dar de tip structura (nu recursiv) : cu sintaxa nume variabila nume camp punctul e (e un operator postfix) struct vect pl; pl x=2; pl y=3; printf ("° of 70f n", pl x, pl y); struct student {    numele complet de tip (inel, "struct") char nume , prenume ;    doua tablouri de caractere char *domiciliu;    doar ADRESA, nu aloca si memoria pt sir char nr tel ;    max 9 cifre + terminator  0 float medie an ;    declaratiile campurilor de structura float nota dipl;   la fel ca declaratiile de variabile } s;    declara var s de tip struct student strcpy(s nume, "Stefanovici");    NU atribuire, e tablou s domiciliu = "str Linistei nr 2";    sau malloc + strepy s medie an =9 35;   un camp e folosit ca orice variabila Numele campurilor se vad doar in interiorul structurii nu putem folosi doar numele campului, doar numevar camp => tipuri structuri diferite pot avea campuri numite la fel Structurile fi atribuite in totalitatea lor struct vect vl = {2, 3}, v2; v2 = vl; Structurile fi transmise catre   returnate de functii (cand sunt mari, se prefera transmiterea   returnarea de pointeri) struct vect add(struct vect vl, struct vect v2) struct vect v; v x = vl x + v2 x; v y = vl y + v2 y; return v; Putem scrie de tip structura indicand tipul intre ( ) struct vect vl; vl = (struct vect){-4, 5}; structuri cu operatori logici => trebuie comparate camp cu camp: if (vl x==v2 x && vl y==v2 y) Putem da noi nume la tipuri existente (mai expresive; sau mai scurte, fara struct): Forma generala: typedef nume-tip-existent Ex typedef double ; typedef struct vect ; (ca declaratia de variabile + typedef in fata => declara un ) Numele nou se poate da direct in definirea tipului: typedef struct student {  * ceva campuri *  } student t; sau separat de definirea tipului structura propriu-zis: struct student {  * ceva campuri *  };    defineste tipul typedef struct student student t;    declara numele student t sinonim cu struct student Putem accesa campurile cu ajutorul unui pointer la structura: struct student *p, s; p = &s; (*p),nota dipl = 9 50; Operatorul e echivalent cu indirectarea urmata de selectie: pointer->numecamp echivalent cu (*pointer) numecamp Operatorii si -> au , ca si () si П Atentie la ordinea de evaluare i p->x++ inseamna (p->x)++ (-> e prioritar) ++p->x inseamna ++(p->x) (-> e prioritar) *p->x inseamna *(p->x) (-> e prioritar) *p->s++ inseamna *((p->s)++) (++e prioritar lui *) in C, tipurile agregat (compuse) pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : doua tablouri de aceias indici, folosite impreuna => inlocuim cu un tablou de element structura: char* nume luna = { "ianuarie",  * , *  "decembrie" }; char zile luna = { 31, 28, 31, 30,  * , *  30, 31 };    e preferabila varianta urmatoare struct luna { char *nume; int zile; }; struct luna luni = {{"ianuarie",31}, , {"decembrie",31}}; Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinital) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {    struct wl e un tip, incomplet definit char *word;    cuvantul: informatia propriu-zisa struct wl *next;    pointer la structura de acelasi tip    acum definitia tipului e completa Un arbore binar, avand in noduri numere intregi: typedef struct t tree;    def tipul incomplet tree = struct t struct t { int val; tree *left, *right;    foloseste numele din typedef    aici tipul struct t e complet si echivalent cu t Vrem sa reprezentam mai multe informatii cat mai compact pe biti Ex data=intreg pe 32 de biti: sec, min (0-59): 6 biti, ora (0-23), ziua (1-31): 5 biti, luna (1-12): 4 biti), an (1970 + 0-63): 6 biti Campurile incep la bitii 0, 6, 12, 17, 22, 26 Construim: int data = 39 " 26 | 5 " 22 | 19 " 17 | 17 " 12; (19 5 2009, 17h) Extragem ora: int ora = data " 12 & OxlF; Sau: acces direct la campuri pe biti, fara masti si operatori pe biti: struct date t {    alternativa: structura cu campuri pe biti unsigned sec, min : 6;    indica numarul de biti unsigned bour, day: 5;    se permit tipuri intregi unsigned month: 4; unsigned year: 6; } data = {0, 0, 17, 19, 5, 39 };    17:00:00, 19 05 (1970+39) Putem scrie direct: printf ("° ou 70u n" , data day, data month); Putem avea campuri fara nume: int: 2;    pe 2 biti sau forta trecerea la memorarea in octetul urmator int: 0; : da nume unui sir de valori numerice folosit cand e mai sugestiv de scris un nume decat un numar luni sc {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; defineste tipul enum luni sc ( e parte din nume i) implicit, sirul valorilor e crescator incepand cu 0 Putem specifica si explicit valori (si o valoare se poate repeta) Un tip enumerare e un tip intreg variabilele valorile enumerare se folosesc ca si intregi enum {D, L, Ma, Mc, J, V, S} zi;    tip anonim+variabila zi int nr ore lucru ;    numar de ore pe zi for (zi = L; zi unei zone alocate cu c maiioc: void *reaiioc(void *ptr, size t size); modifica marimea la size - poate returna alta adresa decat ptr, atunci muta continutul existent => Ex if (pl = realloc(p, size)) { p = pl;  * apoi folosim p *  } Memoria alocata dinamic cand nu mai e necesara void free(void *ptr); elibereaza memoria alocata cu c maiioc int i, n, *t; printf ("Nr de elemente ?") ; scanf ("° od", &n) ; if ((t = malloc(n * sizeof(int))) != NULL) for (i = 0; i uneori dorim sa variem apelata intr-un punct de program Exemplu: parcurgerea unui tablou pentru diverse prelucrari for (int i = 0; i se poate, folosind variabile unei functii reprezinta chiar functiei : de : tip rez Ctipl, , tipn); de (de acelasi tip): tip rez Ctipl, , tipn); se poate atribui pfct = fct; (numele functiei reprezinta adresa ei) Exemplu: int fct(void); declara o ce returneaza un intreg int (*f ct) (void); declara un ce returneaza intreg int *fct(void); e o functie ce returneaza Sintaxa pointerilor de functii e complicata => e util sa declaram un tip: typedef void (*funptr)(void);    tip pointer la functie void funptr funtab ;    tablou de pointeri de functie void Programarea calculatoarelor Curs 10 Marius Minea Programarea calculatoarelor Alocare dinamica Pointeri la functii 6 void mul3(int *p) { *p *= 3; } void tip(int *p) { printf ("° od ", *p); } void prel(int tab[], int len, void (*fp)(int *p)) { for (int i = 0; i 0) => foloseste argumente void * fiind compatibile cu pointeri la orice tip typedef int (*comp t)(const void *, const void *);  tip ptr fct cmp int intcmp(int *pl, int *p2) { return *pl - *p2; }  fct cmp intregi int tab = { -6, 3, 2, -4, 0 };    tabloul de sortat qsort(tab, 5, sizeof(int), (comp t)intcmp);    sorteaza crescator Programarea calculatoarelor Curs 10 Marius Minea 6 decembrie 2004 Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 2 Functiile malloc calloc realloc si free gestioneaza memoria pentru cererile facute de programul utilizator la rulare, pornind de la totalul de memorie pus la dispozitie de sistemul de operare Probleme de rezolvat: - gasirea unui bloc de memorie de dimensiune potrivita (malloc) - returnarea unui bloc in multimea celor disponibile (free) - fragmentarea cat mai redusa in urma cererilor repetate - compactarea in blocuri mai mari a fragmentelor adiacente eliberate - structuri de date si algoritmi pentru implementare eficienta Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 3 - initial, un singur bloc cu intreaga memoria disponibila pt alocare (eventual poate fi crescuta prin apeluri la sistemul de operare) - din acest bloc se separa cantitatile alocate la cerere - ulterior, acestea pot fi eliberate si returnate => fragmentarea memoriei; trebuie o lista de blocuri disponibile informatia necesara pentru gestionare: - fiecare bloc contine un antet, pe langa portiunea utila, cu: lungimea blocului, si un fanion de utilizare (bit: alocat liber) -in blocurile libere (in plus): un pointer la urmatorul liber din lista (eventual doi pointeri, pentru lista dublu inlantuita) => e necesara o lungime minima a blocurilor pentru a cuprinde antetul - informatia din antet poate fi codificata pentru a ocupa spatiu minim - pentru un bloc alocat, e necesar doar bitul de alocare + dimensiunea Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 4 - daca permitem alocarea blocurilor de orice dimensiuni, structurile de date si algoritmii devin mai complicati si ineficienti - solutia: se selecteaza un sir s^, , sn de dimensiuni permise orice solicitare e rotunjita in sus la cea mai mica lungime cuprinzatoare => e suficient sa se tina minte o lista de blocuri libere pentru fiecare dimensiune permisa Sj (aceasta include informatia de gestiune!) Problema: daca nu exista un bloc disponibil de dimensiune trebuie fragmentat unul mai mare Pentru a nu crea blocuri de alte dimensiuni: sistemul buddy [Knuth, 1973]: = Sj + (de ordinul k) - pentru к = 0: sistemul exponential: 1, 2, 4, (puterile lui 2) - pentru к = 1: sistemul Fibonacci: 1, 2, 3, 5, 8, in practica, se porneste de la o dimensiune minima a blocurilor (multipli de cuvant de memorie, ex 4, 8, 16) Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 5 Conceptual: struct block { unsigned char used; size t size; struct block *prev; struct block *next; } b;  * ocupa 16 octeti *  Optimizat prin codificare pe biti: struct block { unsigned used: 1; unsigned szhi unsigned prev unsigned szlo 2; 29; 3; unsigned next: 29; } b;  * incape pe 8 octeti *  Valoarea size = b szhi " 3 + b szio reprezinta un indice in tabela cu dimensiunile permise => pe 5 biti se pot codifica 32 de dimensiuni E natural ca blocurile sa fie aliniate la multipli de 8 octeti => pointerii (pe 32 de biti) se obtin cu: (struct block *)(b prev " 3) Transformarea intregilor in pointeri e frecventa in rutine de nivel scazut dar nu e portabila si nu se recomanda in aplicatii obisnuite Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 6 Blocurile libere se memoreaza in cate o lista pentru fiecare dimensiune: struct block *free[NUMSiZE];  * tablou dupa nr de dimensiuni *  - cand un bloc e eliberat, testam daca poate fi recombinat cu blocul din care a fost desprins initial (daca si fragmentul adiacent e liber) - in sisteme buddy exponentiale, un bloc de dimensiune 2k se afla la deplasamentul d = n • 2k in memoria disponibila Perechea sa (tot cu dimensiunea 2k) are adresa: d-2k, pt n impar; d + 2k pt n par - pt sisteme buddy de ordin к > 0, gasirea perechii e mai complicata: la despartirea intregului spatiu sn cf relatiei ^ | і = + in fiecare bloc se contorizeaza de cate ori consecutiv ein stanga ultimei separari: daca = Bt + В1 к, atunci В^ спЬ = Bi ^ 1 cnt + 1 si B^ cnt = 0 - la eliberare, daca Bj cnt = 0, perechea e blocul В^к din stanga; - daca Bj cnt Ф 0, perechea de testat e blocul B^k din dreapta lui Programarea calculatoarelor 2 Curs 10 Marius Minea 18 decembrie 2002 Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 2 Recursivitatea e un concept fundamental in matematica si informatica Un obiect (o notiune) e recursiv(a) daca e folosit in propria sa definitie Exemplu din matematica: siruri recurente - progresie aritmetica: xq = a, xn = жп і + p, pentru n > 0 - sirul lui Fibonacci: Fq = 1, = 1, Fn = Fn ^ + Fn ? pentru n > 1 Recursivitatea in limbajul C: - functii recursive: o functie f care se apeleaza pe sine insusi (direct) sau indirect, ex f apeleaza pe g, g apeleaza pe h, iar h pe f - tipuri de date recursive (tip structura cu camp pointer la acel tip) typedef struct 1 { int info;  * sau mai multe campuri cu diverse date *  struct 1 *next;  * pointer la acelasi tip *  } list;  * definim list ca nume de tip pentru struct 1 *  Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 3 O definitie recursiva trebuie sa fie bine formata - o notiune nu se poate defini doar in functie de sine insusi (ж = ж) - o definitie recursiva se poate folosi doar de notiuni deja definite NU: xn = жп рі — 1, pentru n > 0 => orice sir de apeluri de functii recursive trebuie sa se opreasca (nu va genera un calcul infinit) in general, distingem: - un caz de baza (pentru care notiunea e definita direct) (ex a° = 1) - un pas inductiv (recursivitatea propriu-zisa) (ex ап+г = ап * a) Cu principiul inductiei, demonstram F(n + 1) stiind F(z) pentru i ne asiguram ca recursivitatea se va opri la cazul de baza Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 4 Recursivitatea si iteratia sunt notiuni strans legate Orice program recursiv poate fi transformat mecanic intr-unul care utilizeaza doar iteratia (pe acelasi principiu folosit de compilator la generarea de cod pentru apeluri de functii, folosind o stiva) invers, semantica unui ciclu (cu test initial) poate fi definita recursiv: if ( cond ) { z , 4 instructiune; while ( cond ) while ( cond ) instructiune; instructiune; -in general, codul scris folosind doar iteratia e mai eficient - dar o solutia recursiva e adesea cea mai simpla, eleganta si naturala Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 5 if (n == 0) return 1; else return n * fact(n-l); int fact nonrec(int n) int p = 1; while (n > 0) { p = p * n; n = n - 1; return p; => transcriere simpla dintr-o varianta in alta; in cea recursiva, valoarea factorialului se acumuleaza automat in expresia returnata (in varianta recursiva, e necesara variabila p) Atentie la conditiile limita ! fact va cicla infinit pentru n = 0;  * vrem 0 pt n negativ *  else return fib(n-l)+fib(n-2); int i, *f, res; if (n = 0; f = malloc(n * sizeof(int)); f El] = f E0] =1; for (i = 2; i nr de apeluri (cate pt fib(5)?) e exponential in n (f ineficient) Obs completati fib nonrec pt a functiona corect pt n deja calculat *  else return f[n] = fib memo(n-1) + fib memo(n-2);  * memoram in f[n] inainte de a returna valoarea *  Cate apeluri se efectueaza pentru fib memo(5) ? Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 8 Adesea, cazul de baza e f simplu (ex test si returnarea unei valori) in comparatie, costul unui apel de functie poate fi semnificativ => Putem trata cazul de baza fara a mai face un apel suplimentar #define MAX 100 int f [MAX+1] = {1, 1};  * restul zero *  int fib r(int n)  * pentru n >= 2 *  return f[n] = (f[n-l]?f[n-1]:fib r(n-1))+(f[n-2]?f[n-2]:fib r(n-2))  * testam f[k] pt a decide daca sa apelam recursiv sau nu *  int fib main(int n)  * se apeleaza de utilizator *  if (n = 0; else if (n > MAX) return -1;  * eroare *  else return fib r(n); Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 9 Una din principalele aplicatii ale recursivitatii: rezolvarea unei probleme prin descompunerea in subprobleme mai mici Exemplu: Sa se genereze toate sirurile de n cifre binare (in total 2n) Definitie recursiva: n— 1 cifre binare, urmate de 0 sau 1 (descompunere in doua subprobleme mai mici) #define N 10 char s [N+l]; s[N] = ’ 0J; bitstrings(s+N, N) ; void bitstrings(char *s, int n) { if (n == 0) puts(s); else { —s; *s = ’O’; bitstrings(s, n-1); *s = ’l’; bitstrings(s, n-1); }  * completeaza de la coada *  Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 10 Exemplu: puts: tiparirea unui sir de caractere, urmat de ’ n’ - pentru sirul vid (' 0'), tipareste ’ n’ - altfel, tipareste primul caracter, tipareste restul sirului void puts(char *s) if (*s) { putchar(*s) ; puts(s+1); } else putchar(’ п’); void puts(char *s) while (*s) { putchar(*s); s = s+1; in cazul recursivitatii la dreapta (apelul recursiv este ultimul lucru) - transformam in bucla, cu aceeasi conditie de continuare - actualizam variabilele cu valorile argumentelor din apelul recursiv Utilizarea si programarea calculatoarelor Curs 10 Marius Minea Recursivitate 11 Poate fi necesara rescrierea, pentru a aduce apelul recursiv la sfarsit Ex factorialul, cu parametru suplimentar produsul acumulat deja int fact prod(int n, int p) if (n > 0) { p = p * n; return fact prod(n-l, p); } else return p;  * apelat cu fact prod(n, 1) *  int fact nonrec(int n) int p = 1; while (n > 0) { p = p * n; n = n - 1; return p; Pentru mai mult de un apel recursiv, e necesara folosirea unei stive Utilizarea si programarea calculatoarelor Curs 10 Marius Minea 6 decembrie 2005 Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h 2 - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie #include sau #include "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) #define LEN 20  * substitutie textuala simpla *  int tab[LEN];  * pentru definirea de constante simbolice *  for (i = 0; i (В) ? (A) : (B)) #define swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } Obs: substitutia se face textual => pot aparea probleme subtile - folositi paranteze in jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h 3 Operatorul # aplicat unui argument de macro produce un sir de caractere care are ca si continut argumentul macro-ului #define mkstring(x) # x in acest caz, mkstring(nume) devine "nume" Operatorul ## are ca efect concatenarea elementeror lexicale de dinainte si de dupa Exemplu: #define concat(x,y) x ## y in acest caz, concat(unu, doi)) devine unudoi Obs : in standardul C doua consecutive sunt echivalente cu concatenarea lor: "unu" "doi" e echivalent cu "unudoi") Observatie: de regula, definitia unui macro nu include un ; final; acesta e scris in program dupa folosirea macro-ului, obtinand un aspect uniform la scriere (ca si cum ar fi un apel de functie) Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h 4 pt a compila selectiv portiuni de cod din program in functie de optiuni (caracteristici arhitecturale; pt depanare; functionalitate in plus; etc) Sintaxa: grup-cod ::= test-if grup-cod grupuri-elifOpt grup-elseopt #endif test-if ::= #if expr-const | #ifdef identificator | #ifndef identificator grup-elif ::= #elif expr-const grup-cod (toate # apar grup-else ::= #else grup-cod pe linie noua) expr-const ::= cele obisnuite | #define DEBUG  * daca depanam *   * cod obisnuit *  #ifdef DEBUG printf("am ajuns aici, x = "); #endif  * alt cod obisnuit *  identificatori predefiniti: FiL defined identificator #if defined GNUC  * compilator GNU *  #if GNUC == 2  * versiunea 2 *   * cod specific pt versiune *  #else  * alta versiune *   * cod specific pt alta versiune *  #endif #endif ; LiNE DATE TiME Ex: fprintf (stderr, "eroare in ° os linia ° od n" , FiLE , LiNE ); Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h 5 Functiile de tipul printf scanf au numar variabil de argumente ( ) Pentru a implementa o astfel de functie, trebuie un mod de acces la argumentele cu numar variabil, pornind de la ultimul arg numit => limbajul C defineste o serie de macro-uri in stdarg h - tipul va iist pentru a retine informatii despre lista de argumente void va start(va list ap, ultimarg); - initializeaza ap pornind de la adresa ultimului argument tip va arg(va list ap, tip); - returneaza urmatorul argument din lista, presupus a fi de tipul tip apelata repetat pentru fiecare argument; tipul argumentelor si numarul lor trebuie deduse din argumentele fixe (ex formatul la print scanf) void va copy(va list dest, va list src); - copiaza un va list, inclusiv punctul curent de prelucrare atins void va end(va list ap); - apelat pentru incheierea corecta a prelucrarii argumentelor Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h б - declaratii similare, dar in loc de apare va iist ap: int vprintf(const char *format, va list ap); int vscanf(const char *format, va list ap); similar: vfprintf, vfscanf, vsprintf, vsscanf, vsnprintf - se folosesc cand dorim sa facem intai o prelucrare preliminara, si apoi sa apelam printf scanf etc cu argumentele ramase void errprintf(const char *format, ) va list ap; va st art(ap, f ormat); fprintf (stderr, "Error: ° os; " vfprintf(stderr, format, ap); va end(ap); strerror(errno)); Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h Preprocesorul C stdarg h б decembrie 2005 Programarea calculatoarelor 2 Curs 10 Marius Minea - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie #include sau #include "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) #define LEN 20  + substitutie textuala simpla +  int tab [LEN];  + pentru definirea de constante simbolice +  for (i = 0; i (В) ? (A) : (B)) #define swapint(a, b) { int tmp; tmp = a; a = b; b = tmp; } Obs: substitutia se face textual => pot aparea probleme subtile - folositi paranteze in jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2x in max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Programarea calculatoarelor 2 Curs 10 Marius Minea Operatorul # aplicat unui argument de macro produce un sir de caractere care are ca si continut argumentul macro-ului #define mkstring(x) # x in acest caz, mkstring(nume) devine "nume" Operatorul ## are ca efect concatenarea elementeror lexicale de dinainte si de dupa Exemplu: #define concat(x,y) x ## у in acest caz, concat(unu, doi)) devine unudoi Obs : in standardul C doua consecutive sunt echivalente cu concatenarea lor: "unu" "doi" e echivalent cu "unudoi") Observatie: de regula, definitia unui macro nu include un ; final; acesta e scris in program dupa folosirea macro-ului, obtinand un aspect uniform la scriere (ca si cum ar fi un apel de functie) Programarea calculatoarelor 2 Curs 10 Marius Minea Preprocesorul C stdarg h Preprocesorul C stdarg h Preprocesorul C stdarg h pt a compila selectiv portiuni de cod din program in functie de optiuni (caracteristici arhitecturale; pt depanare; functionalitate in plus; etc) Sintaxa: grup-cod ::= test-if grup-cod grupuri-elifopt grup-elseopt #endif test-if ::= #if expr-const | #ifdef identificator | #ifndef identificator grup-elif ::= #elif expr-const grup-cod (toate # apar grup-else ::= #else grup-cod pe linie noua) expr-const ::= cele obisnuite | Sdeflne DEBUG  * daca depanam *   * cod obisnuit *  #lfdef DEBUG printf("am ajuns aici, x = "); Sendlf  * alt cod obisnuit *  identificatori predefiniti: FiLE Ex: fprintf(stderr, "eroare ii defined identificator #lf defined GNUC  * compilator GNU *  #lf GNUC == 2  * versiunea 2 *   * cod specific pt versiune *  #else  * alta versiune *   * cod specific pt alta versiune *  #endlf #endlf LiNE DATE TiME i %s linia %d n", FiLE , LiNE ); Programarea calculatoarelor 2 Curs 10 Marius Minea Functiile de tipul printf scanf au numar variabil de argumente ( ) Pentru a implementa o astfel de functie, trebuie un mod de acces la argumentele cu numar variabil, pornind de la ultimul arg numit => limbajul C defineste o serie de macro-uri in stdarg h - tipul va iist pentru a retine informatii despre lista de argumente void va start (va list ap, Ultimarg) ; - initializeaza ap pornind de la adresa ultimului argument tip va arg(va list ap, t p) ; - returneaza urmatorul argument din lista, presupus a fi de tipul tip apelata repetat pentru fiecare argument; tipul argumentelor si numarul lor trebuie deduse din argumentele fixe (ex formatul la print scanf) void va copy(va list dest, va list src); - copiaza un va list, inclusiv punctul curent de prelucrare atins void va end(va list ap); - apelat pentru incheierea corecta a prelucrarii argumentelor Programarea calculatoarelor 2 Curs 10 Marius Minea - declaratii similare, dar in loc de apare va list ap: int vprintf(const char tformat, va list ap); int vscanf(const char tformat, va list ap); Similar: vfprintf, vfscanf, vsprintf, vsscanf, vsnprintf - se folosesc cand dorim sa facem intai o prelucrare preliminara, si apoi sa apelam printf scanf etc cu argumentele ramase void errprintf(const char tformat, ) va list ap; va start(ap, format); fprintf(stderr, "Error: %s; ", strerror(errno)); vfprintf(stderr, format, ap); va end(ap); } Programarea calculatoarelor 2 Curs 10 Marius Minea 7 decembrie 2005 Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 2 Functiile malloc calloc realloc si free gestioneaza memoria pentru cererile facute de programul utilizator la rulare, pornind de la totalul de memorie pus la dispozitie de sistemul de operare Probleme de rezolvat: - gasirea unui bloc de memorie de dimensiune potrivita (malloc) - returnarea unui bloc in multimea celor disponibile (free) - fragmentarea cat mai redusa in urma cererilor repetate - compactarea in blocuri mai mari a fragmentelor adiacente eliberate - structuri de date si algoritmi pentru implementare eficienta Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 3 - initial, un singur bloc cu intreaga memoria disponibila pt alocare (eventual poate fi crescuta prin apeluri la sistemul de operare) - din acest bloc se separa cantitatile alocate la cerere - ulterior, acestea pot fi eliberate si returnate => fragmentarea memoriei; trebuie o lista de blocuri disponibile informatia necesara pentru gestionare: - fiecare bloc contine un antet, pe langa portiunea utila, cu: lungimea blocului, si un fanion de utilizare (bit: alocat liber) -in blocurile libere (in plus): un pointer la urmatorul liber din lista (eventual doi pointeri, pentru lista dublu inlantuita) => e necesara o lungime minima a blocurilor pentru a cuprinde antetul - informatia din antet poate fi codificata pentru a ocupa spatiu minim - pentru un bloc alocat, e necesar doar bitul de alocare + dimensiunea Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 4 - daca permitem alocarea blocurilor de orice dimensiuni, structurile de date si algoritmii devin mai complicati si ineficienti - solutia: se selecteaza un sir s^, , sn de dimensiuni permise orice solicitare e rotunjita in sus la cea mai mica lungime cuprinzatoare => e suficient sa se tina minte o lista de blocuri libere pentru fiecare dimensiune permisa Sj (aceasta include informatia de gestiune!) Problema: daca nu exista un bloc disponibil de dimensiune trebuie fragmentat unul mai mare Pentru a nu crea blocuri de alte dimensiuni: sistemul buddy [Knuth, 1973]: = Sj + (de ordinul k) - pentru к = 0: sistemul exponential: 1, 2, 4, (puterile lui 2) - pentru к = 1: sistemul Fibonacci: 1, 2, 3, 5, 8, in practica, se porneste de la o dimensiune minima a blocurilor (multipli de cuvant de memorie, ex 4, 8, 16) Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 5 Conceptual: struct block { unsigned char used; size t size; struct block *prev; struct block *next; } b;  * ocupa 16 octeti *  Optimizat prin codificare pe biti: struct block { unsigned used: 1; unsigned szhi unsigned prev unsigned szlo 2; 29; 3; unsigned next: 29; } b;  * incape pe 8 octeti *  Valoarea size = b szhi " 3 + b szio reprezinta un indice in tabela cu dimensiunile permise => pe 5 biti se pot codifica 32 de dimensiuni E natural ca blocurile sa fie aliniate la multipli de 8 octeti => pointerii (pe 32 de biti) se obtin cu: (struct block *)(b prev " 3) Transformarea intregilor in pointeri e frecventa in rutine de nivel scazut dar nu e portabila si nu se recomanda in aplicatii obisnuite Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 6 Blocurile libere se memoreaza in cate o lista pentru fiecare dimensiune: struct block *free[NUMSiZE];  * tablou dupa nr de dimensiuni *  - cand un bloc e eliberat, testam daca poate fi recombinat cu blocul din care a fost desprins initial (daca si fragmentul adiacent e liber) - in sisteme buddy exponentiale, un bloc de dimensiune 2k se afla la deplasamentul d = n • 2k in memoria disponibila Perechea sa (tot cu dimensiunea 2k) are adresa: d-2k, pt n impar; d + 2k pt n par - pt sisteme buddy de ordin к > 0, gasirea perechii e mai complicata: la despartirea intregului spatiu sn cf relatiei ^ | і = + in fiecare bloc se contorizeaza de cate ori consecutiv ein stanga ultimei separari: daca = Bt + В1 к, atunci В^ спЬ = Bi ^ 1 cnt + 1 si B^ cnt = 0 - la eliberare, daca Bj cnt = 0, perechea e blocul В^к din stanga; - daca Bj cnt Ф 0, perechea de testat e blocul B^k din dreapta lui Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice Aplicatii implementarea alocarii dinamice 7 decembrie 2005 Functiile malioc caiioc realloc si free gestioneaza memoria pentru cererile facute de programul utilizator la rulare, pornind de la totalul de memorie pus la dispozitie de sistemul de operare Probleme de rezolvat: - gasirea unui bloc de memorie de dimensiune potrivita (malioc) - returnarea unui bloc in multimea celor disponibile (free) - fragmentarea cat mai redusa in urma cererilor repetate - compactarea in blocuri mai mari a fragmentelor adiacente eliberate - structuri de date si algoritmi pentru implementare eficienta - initial, un singur bloc cu intreaga memoria disponibila pt alocare (eventual poate fi crescuta prin apeluri la sistemul de operare) -din acest bloc se separa cantitatile alocate la cerere - ulterior, acestea pot fi eliberate si returnate => fragmentarea memoriei; trebuie o lista de blocuri disponibile informatia necesara pentru gestionare: - fiecare bloc contine un antet, pe langa portiunea utila, cu: lungimea blocului, si un fanion de utilizare (bit: alocat liber) -in blocurile libere (in plus): un pointer la urmatorul liber din lista (eventual doi pointeri, pentru lista dublu inlantuita) => e necesara o lungime minima a blocurilor pentru a cuprinde antetul - informatia din antet poate fi codificata pentru a ocupa spatiu minim - pentru un bloc alocat, e necesar doar bitul de alocare + dimensiunea Programarea calculatoarelor 2 Curs 10 Marius Minea Programarea calculatoarelor 2 Curs 10 Marius Minea Programarea calculatoarelor 2 Curs 10 Marius Minea Aplicatii implementarea alocarii dinamice 4 Aplicatii implementarea alocarii dinamice Aplicatii implementarea alocarii dinamice -daca permitem alocarea blocurilor de orice dimensiuni, structurile de date si algoritmii devin mai complicati si ineficienti -solutia: se selecteaza un sir si, "2, , sn de dimensiuni permise orice solicitare e rotunjita in sus la cea mai mica lungime cuprinzatoare => e suficient sa se tina minte o lista de blocuri libere pentru fiecare dimensiune permisa si (aceasta include informatia de gestiune!) Problema: daca nu exista un bloc disponibil de dimensiune s^, trebuie fragmentat unul mai mare Pentru a nu crea blocuri de alte dimensiuni: sistemul buddy [Knuth, 1973]: sq i =si + si fe (de ordinul fc) - pentru к = 0: sistemul exponential: 1, 2, 4, (puterile lui 2) - pentru к = 1: sistemul Fibonacci: 1, 2, 3, 5, 8, in practica, se porneste de la o dimensiune minima a blocurilor (multipli de cuvant de memorie, ex 4, 8, 16) Conceptual: struct block { unsigned char used; size t size; struct block *prev; struct block *next; } b;  * ocupa 16 octeti *  Optimizat prin codificare pe biti: struct block { unsigned used: 1; unsigned szhi: 2; unsigned prev: 29; unsigned szlo: 3; unsigned next: 29; } b;  * incape pe 8 octeti *  Valoarea size = b szhi " 3 + b szlo reprezinta un indice in tabela cu dimensiunile permise ==- pe 5 biti se pot codifica 32 de dimensiuni E natural ca blocurile sa fie aliniate la multipli de 8 octeti => pointerii (pe 32 de biti) se obtin cu: (struct block +)(b prev " 3) Transformarea intregilor in pointeri e frecventa in rutine de nivel scazut dar nu e portabila si nu se recomanda in aplicatii obisnuite Blocurile libere se memoreaza in cate o lista pentru fiecare dimensiune: struct block *free[NUMSiZE];  + tablou dupa nr de dimensiuni +  - cand un bloc e eliberat, testam daca poate fi recombinat cu blocul din care a fost desprins initial (daca si fragmentul adiacent e liber) - in sisteme buddy exponentiale, un bloc de dimensiune 2fe se afla la deplasamentul d = n • 2fe in memoria disponibila Perechea sa (tot cu dimensiunea 2fe) are adresa: d — 2k, pt n impar; d  -2k pt n par - pt sisteme buddy de ordin к > 0, gasirea perechii e mai complicata: la despartirea intregului spatiu sn cf relatiei = з^4-з^ Й1 in fiecare bloc se contorizeaza de cate ori consecutiv e in stanga ultimei separari: daca = Bi + В} к, atunci Bt cnt = B^-^ cnt-^- 1 si B^ cnt = 0 - la eliberare, daca Bi cnt = 0, perechea e blocul В^г din stanga; - daca Bi cnt ^4 o, perechea de testat e blocul В^ din dreapta lui Programarea calculatoarelor 2 Curs 10 Marius Minea Programarea calculatoarelor 2 Curs 10 Marius Minea Programarea calculatoarelor 2 Curs 10 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  4 decembrie 2017 pot descrie comportamentul unui sistem simplu, din fiecare stare s, intrarea a determina starea urmatoare s' Un automat un limbaj (face parte sirul din limbaj?) ex program cu comentarii incheiate corect : automate care produc iesiri (in functie de intrare) putem limbaje (ex elimina comentarii) Automatele se pot reprezenta st a b c tabel de tranzitii: 0 1 0 0 1 1 2 0 2 1 0 3 2 1 0 0 => putem determina eficient daca un sir e acceptat parcurgem sirul, la fiecare pas tabelul ne da starea urmatoare reprezinta concis , ca automatele Sunt mai usor de compus (din concatenare, alternativa, repetitie) Putem sa cautam in text: identifica (sir nevid de cifre) "images d - -  logo- x png" sizes=" x " sau o dimensiune (de imagine): "images d61 2016-07-06 logo- png" sizes=" " Pentru cautari, expresiile regulate se traduc in automate (mai eficient de lucrat) Dorim sa un limbaj (cat mai simplu clar concis) daca un sir apartine unui limbaj, siruri dintr-un limbaj sau sa astfel de siruri Exista limbaje foarte simple care nu sunt regulate: {anbn | n > 0} {илѵ | w G {a, b}*} {wwR | w G {a, b}*} paranteze echilibrate, ((())) cuvant, apoi repetat cuvant, apoi inversat (palindrom) Automatele finite au numar finit de stari nu pot numara mai mult de atat Pentru primul caz, ar trebui sa numaram n de a, cu n nelimitat in cazul 2 si 3, ar trebui sa memoram cuvinte de lungime arbitrara ca sa le comparam ulterior anbn' cati a apar, verificam ca sunt la fel de multi b Demonstram prin Fie un automat determinist cu care accepta limbajul Fie sirul anbn (cu acelasi n) si starile so si -4 Д sn mai departe, din sn automatul accepta bn Din n+l stari so- sn, doar n pot fi diferite: exista  ' automatul accepta an+-i 'bn (mai multi a decat b), Exemplul anterior e un caz particular al unei proprietati generale : in orice limbaj regulat Эр G N astfel ca orice cuvant w G L cu |w| > p (destul de lung) are forma w = xyz cu |y| >1 se repeta un subsir nevid |xy| 0 xykz G L у poate fi repetat arbitrar intre x si z Fie un limbaj regulat si automatul care-l recunoaste Alegem lungimea de pompare p = numarul de stari din automat Fie sirul aia2 am cu m> p, si starile parcurse de automat:  Э1 ^2 3m Qo Ql Q2 • • •  > Qm Avem m + 1 > p stari, deci cel putin o stare se repeta: qs = qt cu s, t subst NP det NP VP -> verb VP verb NP noun phrase + verb phrase simplu: doar substantiv cu parte determinanta (art adj) predicat simplu: doar verb verb cu complement Am descris limbajul prin (de ) : simboluri care apar in stanga —> (sunt inlocuite): : simboluri care apar numai in dreapta —> Orice limbaj e descris prin si sa: prin care simboluri pot fi combinate corect O descrie cum se obtin sirurile unui limbaj prin ( ) pornind de la un O a unui sir dintr-o gramatica e o secventa de aplicari a care transforma simbolul de start in sirul dat indicam la fiecare pas si simbolul transformat O derivare ne arata ca sirul apartine limbajului definit de gramatica NP NP verb verb noun —> det verb noun —> det det verb noun —> det det noun verb noun —> a good student reads books e o reprezentare a unei derivari, scriind partea dreapta a fiecarei reguli sub partea stanga: S A good student reads books NP VP S NP VP det NP verb NP NP -  " det NP VP - > verb NP a det NP i i 1 reads noun NP - det NP NP - noun 1 1 good noun 1 books NP - -> noun student sirurile de paranteze echilibrate: orice paranteza deschisa are o pereche inchisa o paranteza se inchide dupa inchiderea celor deschise dupa ea (1) S —> e (notatie pentru sirul vid) (2) S -g (S)S O posibila derivare: -4 ( )S-4(( )S)S 4 (() )S 4 (()) 4 (())( )s 4 (())() 4 (0)0 la fiecare pas, am colorat transformat, am indicat regula folosita -4 sau 4- si am subliniat in ce se transforma {wwR | w G {a, b}*} S^e S —> aSa S^bSb cuvant+invers (palindrom, lungime para) O gramatica formala G e formata din: E: o multime de simboluri (din care se formeaza sirurile limbajului)  V: o multime de simboluri , N П E = 0 (folosite doar in descrierea gramaticii, nu apar in limbaj) P' o multime de , de forma (E U A )* V(E U  V)* —> (E и  V)* un neterminal N, eventual intr-un context (sir in stanga dreapta) e rescris cu un sir de terminale si neterminale S G  V: un Limbajul definit de G e format din toate sirurile de care se pot obtine din S printr-o derivare (aplicand oricate reguli) Notam: neterminale А, В; terminale: a,b; siruri arbitrare: a, 3,7 3) gramatici : genereaza ; reguli de forma: A —> a, A —> e, A —> aB (regulate la dreapta), SAU A —> a, A —> e, A —> Ba (regulate la stanga), NU le combinam Conversie in automate: cate o stare pentru fiecare neterminal, A —> aB devine @ ©, A —> a devine @ Д @ (accept) 2) gramatici reguli: A —> 7 stanga: neterminal; dreapta: sir arbitrar 1) gramatici reguli: аА 3 —> ог  3 A e rescris daca apare intre а si  3 ф e (nevid), sau S —> e doar daca S nu apare in dreapta 0) gramatici nerestrictionate (orice reguli de rescriere) limbaje recursiv enumerabile (recunoscute de o masina Turing) dupa John Backus (dezvoltatorul limbajului FORTRAN) si Peter Naur (ALGOL 60) (fiecare: premiul ) Notatie frecvent folosita pentru gramatici independente de context foloseste pentru definitie si pentru alternativa Neterminal ::= rescrierel i rescriere2 | | rescriereN uneori folosite cu extensii: element-optional simbol (steaua Kleene) pentru repetitie simbol (plus) pentru repetitie cel putin odata paranteze pentru gruparea elementelor Stmt ::= ExpStmt | ifStmt | WhileStmt | Block ExpStmt ::= expr ; ifStmt ::= ( expr ) Stmt Stmt | ( expr ) Stmt WhileStmt ::= ( expr ) Stmt Block ::= { Stmt* } Problema: cu care se potriveste ? (x > 0) (y > 0) x = 0; у = 0; O gramatica е daca exista siruri cu mai multi (arbori sintactici) (x > 0) (y > 0) x = 0; у = 0; X > 0 x > 0 у > 0 nimic у > 0 y=0 x=0 y=0 interpretarea corecta x=0 nimic interpretare incorecta (trebuie eliminata) Pentru a dezambigua gramatica, trebuie rescrisa: distingem intre un , care are un , fara Cum e asociat cu cel mai apropiat , ramura e (definim echilibrate restul de instructiuni) Stmt ::= BalancedStmt | UnBalancedlf BalancedStmt ::= ExpStmt | WhileStmt | Block | Balancedlf ExpStmt ::= expr ; WhileStmt ::= ( expr ) Stmt Block ::= { Stmt* } Balancedlf ::= ( expr ) BalancedStmt Stmt UnBalancedlf ::= ( expr ) Stmt vl) E ::= num i E + E i E - E i E * E si aici avem nu e precizata precedenta operatorilor v2) Rescriem pe 3 nivele de E ::= T | E + T | E - T T::=F|T*F|T F F ::= num | ( E ) Exemplu: 2 * (5-3) i E   E i ( E ) in aceasta scriere, E apare primul in stanga productiilor lui E recursivitate la stanga => nu putem implementa direct (nu stim cand sa oprim apelul recursiv) E ::= T | E + T | E - T T::=F|T*F|T F F ::= num | ( E ) v3) Eliminam => putem scrie direct cod E ::= T RestE RestE ::= e | + T RestE | - T RestE T ::= F RestT RestT ::= e | * F RestT |   F RestT F ::= num | ( E ) nu necesita paranteze, subexpresiile reies din structura Expresii : operatorul operanzilor implicit: la fel si in sutexpresii E ::= num | Op E E Op ::= + | - | * |   * - 2 +345 (2 - (3 + 4)) * 5 * Putem scrie direct cod pornind de la aceasta gramatica! Expresii : operatorul operanzi, la fel in subexpresii E ::= num | E E Op Op ::= + | - | * |   2 4 5 - - 7 * = (2 - (4 - 5)) *7 Putem elimina recursivitatea la stanga: E ::= num RestE RestE ::= e | E Op RestE * 4 5 Scrierile se pot obtine prin traversarea arborelui expresiei: in : intai operatorul, apoi subexpresiile (in acelasi fel) in : intai subexpresiile (in acelasi fel), apoi operatorul Tipuri definite de utilizator Programarea calculatoarelor Curs 11 19 mai 2009 Marius Minea Un tip defineste o multime de valori si operatiile posibile cu acestea, in C putem defini tipuri , si : da nume unui sir de valori numerice =4" folosit cand e mai sugestiv de scris un nume decat un numar luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; defineste un tip cu numele enum iuni curs (si e parte din nume' ) implicit, sirul valorilor e crescator incepand cu 0 dar putem specifica si explicit valori (si o valoare se poate repeta) Un tip enumerare e un tip intreg =4" variabilele valorile enumerare se folosesc ca si intregi enum {D, L, Ma, Mc, J, V, S)- zi;    declara tip anonim + variabila zi int nr ore lucru ;    numar de ore pe zi for (zi = L; zi trebuie comparate individual campurile lor : typedef nume-tip-existent nume-tip-nou; ex typedef double real; =4" putem alege un nume mai scurt, fara struct - direct in definirea tipului: typedef struct student {  * ceva campuri *  } student t; - sau separat de definirea tipului structura propriu-zis: typedef struct student {  * ceva campuri *  };    defineste tipul typedef struct student student t;    declara un nume pentru el Programarea calculatoarelor Curs 11 Marius Minea Frecvent: accesul la campuri prin intermediul unui pointer la structura: struct student *p;  * p = *  (*p) nota dipl = 9 50; Operatorul e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si O si [] Atentie la ordinea de evaluare ! p->x++ ++p->x *p->x *p->s++ inseamna inseamna inseamna inseamna (p->x)++ ++(p->x) *(p->x) *((p->s)++) Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite Tmpreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie",  * , *  "decembrie" }; char zile luna = { 31, 28, 31, 30,  * , *  30, 31 };    e preferabila varianta urmatoare struct luna { char *nume; int zile; }; struct luna luni = {{"ianuarie" ,31},  * ,*  {"decembrie",31}}; Programarea calculatoarelor Curs 11 Marius Minea Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! =4" structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {    struct wl e un tip, incomplet definit char *word;    cuvantul: informatia propriu-zisa struct wl *next;    pointer la structura de acelasi tip };    acum definitia tipului e completa Un arbore binar, avand in noduri numere intregi: typedef struct t tree;    defineste struct t { int val; tree *left, *right;    foloseste };    aici tipul struct t Programarea calculatoarelor Curs 11 tipul incomplet tree = struct t numele din typedef e complet si echivalent cu tree Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator 10 Vrem sa reprezentam mai multe informatii cat mai compact pe biti Ex : o data ca intreg pe 32 de biti: sec, min (0-59): 6 biti, ora (0-23), ziua (1-31): 5 biti, luna (1-12): 4 biti), anul (1970 + 0-63): 6 biti Construim : int data = 39 0 - - 0 + si pentru expresii prin tabelul: + 0 - 0 0 0 + - 0 + La fel se poate introduce operatorul minus unar: i - 0 + -1+ o - introducem operatia de adunare =s- abstractia nu mai e precisa + - 0 + — - - T 0 - 0 + + T + + Apar valori care nu pot fi determinate precis (se pierde precizia) e necesara introducerea lui T — {-,0,+} apare din nou notiunea de Similar, la introducerea operatorului de impartire  : nu putem imparti la zero si extindem toate 7 - 0 + T — + -L - T 0 0 ± 0 0 + — -L + T T T ± T T operatiile si la X: ± op x Verificare formala Curs 11 Marius Minea Verificare formala Curs 11 Marius Minea interpretare abstracta 5 interpretare abstracta unui program: un model matematic (formal) al tuturor comportamentelor posibile ale unui sistem de calcul care executa acel program, in interactiune cu orice mediu posibil [cousot] Semantica unui limbaj de programare: defineste semantica oricarui program Abordare generala: semantica unui program poate fi definita ca solutie a unei (corespunzatoare iteratiei) toate semanticile unui program pot fi organizate intr-o ierarhie, dupa nivelul lor de - secvente de executie (finite sau infinite): descriu in fiecare punct valoarea variabilelor din program - semantica operationala: descrie comportamentul la nivel de stari si tranzitii (ca si automat) - semantica denotationala: descrie rezultatul executiei (inel, neter-minare) - semantica naturala: ca mai sus, ignora aspectul neterminarii Verificare formala Curs 11 Marius Minea Verificare formala Curs 11 Marius Minea interpretare abstracta 7 interpretare abstracta - abstractia semn - abstractia pe intervale - abstractia poliedrala (infasuratoarea convexa a valorilor) - abstractia octogonala (ecuatii de forma ±x ) x С Г'(г,(-7')) si Va E A a = ri(-(a)) (abstractizarea urmata de concretizare introduce aproximare; concretizarea urmata de abstractizare e exacta) Aceasta e proprietatea fundamentala care exprima corectitudinea abstractiei ( ): ea poate genera valori suplimentare, dar niciodata nu va omite valori > e o abstractie conservatoare Verificare formala Curs 11 Marius Minea Verificare formala Curs 11 Marius Minea interpretare abstracta 9 interpretare abstracta 10 Fiind data o functie (transformare) in programul f : D -"  D in programul concret, ce corespondent are aceasta in programul abstract ? Raspuns: f f — a o f o 7 Pentru un element abstract x p A: - producem intai multimea de valori concrete 7(0-) - aplicam functia concreta f fiecarei valori, obsinand o multime de valori (concrete) - abstractizam multimea de valori concrete intr-o valoare abstracta (cu obisnuita posibila pierdere de precizie) Semantica unui program e data in general de o ecuatie de punct fix (datorata ciclurilor din program) - am vazut deja ecuatii de punct fix pentru analiza de flux de date Avem: - punctul fix al functiei f in domeniul concret - punctul fix al functiei ft in domeniul abstract - concretizarea punctului fix al lui ft Atunci, ifp  C 7(lfpft) Verificare formala Curs 11 Marius Minea Verificare formala Curs 11 Marius Minea interpretare abstracta 11 interpretare abstracta 12 Problema: daca lantul ascendent in calculul de punct fix are lungime infinita (laticea e de inaltime infinita in raport cu functia transformarea data), nu se poate determina un punct fix intr-un numar finit de pasi while (x >= 0) x = x + 1; Ex analiza codului de mai sus chiar cu intervale Pe de alta parte, "ghicind" intervalul [0,oo) e clar ca acesta e punct fix (si punctul fix minimal) Permite eliminarea lanturilor de lungime infinita la calculul de punct fix, in doi pasi: - la inceput, o aproximare mai grosiera a lantului ascendent, care conduce la convergena mai rapida (in numar finit de pasi) - apoi, o revenire la precizie mai buna, printr-un lant de aproximari descendente, spre punctul fix propriu-zis Verificare formala Curs 11 Marius Minea Verificare formala Curs 11 Marius Minea Programare dinamica 10 ianuarie 2005 - pentru probleme de optimizare - alegerea optimului local in scopul de a obtine un optim global (nu e valabila universal; uneori, e doaer o euristica) Exemple: arborele minim de cuprindere intr-un graf - cand nu se poate determina sigur pasul care conduce la succes - e necesara o cautare exhaustiva in spatiul starilor - cautare recursiva (in adancime), cu revenire in caz de esec - rezolvarea unei probleme prin descompunerea in probleme mai mici - tipic: structura recursiva (exemplu: quicksort) Programarea calculatoarelor 2 Curs 11 Marius Minea Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 3 Programare dinamica Fie matricile Am,n (m linii, n coloane) si Bn,p (n linii, p coloane) Pentru a calcula produsul avem nevoie de m   n -p inmultiri for (i = 0; i pentru metrici 4q- 4i   - 4,у 1 produsele individuale pot fi calculate in diverse ordini ex pt A10,100, S100,5' Q>,50: ( 4B)C: 10   100   5 + 10   5   50 = 5000 + 2500 = 7500 inmultiri 4(BC): 100   5   50 + 10   100   50 = 25000 + 50000 = 75000 inmultiri : Care e ordinea calculelor pt numar minim de inmultiri ? Programarea calculatoarelor 2 Curs 11 Marius Minea Subproblema: Care e numarul P(rt) de grupari posibile de paranteze ? Solutie: relatie recursiva: pe ce pozitie 1 nr minim de inmultiri in 4,-     4д e (cu separare inainte de A,): тц — 0, гтГ'ід — РііПі calculul se poate face completand tabloul global double m[N] [N]; si tabloul int p[N] [N]; cu pozitia la care se face ultima inmultire for (c = 1; c i; ) -{  * pt toate pozitiile intermediare *  double v = d[i]*d[j]*d[k]+m[j] [k] ; v+=m[i] [—j] ; if (v 1 descompuneri posibile Domeniu de aplicatie: in special probleme de optimizare - cu proprietatea de descompunere optimala optimal substructure (solutia optima a problemei contine solutii optime la subprobleme) - de regula un tablou pentru cost + unul pentru a retine solutiile - consumul de memorie: adesea semnificativ (patratic sau mai mult) Programarea calculatoarelor 2, Curs 11 Marius Minea Una din sarcinile de rezolvat: in ce ordine se rezolva subproblemele (se completeaza elementele tabelului) ? Adesea: ordine naturala (ex de la indici mici) => program usor de scris Dar, nu intotdeauna e evident => abordarea recursiva e mai naturala Calculul combinarilor: C" = + C'^Zi Pt 0 daca valoarea a fost calculata, o returneaza; daca nu, o calculeaza recursiv si o memoreaza inainte de a o returna - Calculul recursiv cu memoizare: mai natural de scris; mai eficient daca pentru rezultatul cerut nu trebuie rezolvate toate subproblemele - Calculul de Jos in sus: cod mai eficient (fara apeluri de functii), dar rezolva exhaustiv toate subproblemele (chiar nenecesare) O multime de chei trebuie aranjate intr-un arbore binar de cautare (cheile din subarborele stang ^ij—i 0 (arb vid) (suma Pt ca fiecare nod e cu 1 mai Jos decatin subprobleme) Completarea tabloului: in ordine crescatoare a diferentei k-i (numarul de noduri), in paralel cu tabloul г,д pentru radacina arborelui Programarea calculatoarelor 2 Curs 11 Marius Minea Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica Programare dinamica 10 Se dau N (tipuri de) obiecte cu dimensiuni Si si valori intregi Care e valoarea maxima a unor obiecte de dimensiune totala data D ? Problema rucsacului are multe variante ! Daca se permit fragmente de obiecte, problema are solutie greedy Daca dimensiunile sunt reale, problema e NP-completa (exponentiala) Varianta 1: numar nelimitat de obiecte de fiecare tip for (d = 1; d c[i]) c[i] = m; Varianta 2: obiecte unice; c[d] [i]: cost max pt dim d, obiecte 0 І for (d = 1; d l[i] Cj-1]) { l[i][j]=l[i-l][j]; d[i] [j]=l; } else { l[i][j] = l[i][j-l]; d[i] [J] = 2; } Programarea calculatoarelor 2 Curs 11 Marius Minea Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica Programare dinamica 12 Se dau doua siruri de lungimi m si n Sa se determine costul minim al operatiilor de editare necesare pentru a transforma un sir in celalalt, prin adaugarea   stergerea   schimbarea unui caracter (Obs: schimbarea are sens daca costul primele j din у *  for (i = 0; i = 0; —k, —i) { c[i] [k] = DBL-MAX; for (j = k; —j > i; ) { double m = w(i,j,k) + c[i][j] + c[j][k]; if (m n p S2(f(n)) daca timpul de rulare este > c (n), pt n > ng se studiaza pentru cazul cel mai defavorabil si cel mediu - vom rationa despre corectitudinea algoritmilor folosind invarianti Utilizarea si programarea calculatoarelor Curs 11 Marius Minea Utilizarea si programarea calculatoarelor Curs 11 Marius Minea Sortare si cautare Sortare si cautare sa generam un tablou de numere aleatoare pe care sa le sortam, int rand(void);  * in stdlib h *  genereaza numar pseudoaleator intre o si rand max void srand(unsigned seed); seteaza starea initiala pentru generatorul de numere pseudoaleatoare OBS: in absenta apelului la srand, functia rand va repeta aceeasi secventa generata pentru fiecare rulare - se poate initializa generatorul in functie de ceas (time h): time t time(time t *timer); (time t 0 unsigned long) ret nr de secunde trecute de la o data origine (UNiX: 1 ian 1970) daca param, pointer e nenul, valoarea se stocheaza si la acea adresa const int N=100; const int MaX=1000; int i, a[N] ; srand((int)time(NULL));  * initializeaza generatorul *  for (i = 0; i = i; j—)  * if (a[j] preferabil daca dimensiunea elementelor este mare invariant: acelasi ca la bubblesort: dupa iteratia i (1 = i && a[r] >= p) r—; if (1 i) quicksort (a, i, r); if (1 void main(void) unsigned m, lo = 0, hi = (1 " 10) - 1; printf("Ganditi-va la un numar intreg intre 0 si * ,d n", hi); do { m = (lo + hi) " 1; printf ("Numarul e mai mare decat 7,d ? (d n) ", m); if (tolower(getchar()) == ’d’) lo = m+1; else hi = m; while (getcharO != ’Xn’); }• while (lo int 1, int r) { while(l a[m]) l=m+l; else r=m; if (v==a ) return 1; else return -1; int bsrch(int v, int *a, int 1, int r) { int m; if (l a [m]) return bsrch(v, a, m+1, r); else return bsrch(v, a, 1, m); } else if (v==a[l]) return 1; else return -1; void *bsearch(const void *key, const void *base, size t nmemb, size t size, int (*compar)(const void *, const void *)); Utilizarea si programarea calculatoarelor Curs 11 Marius Minea 19 Programarea calculatoarelor Curs 11 mai 2009 Marius Minea Tipuri definite de utilizator 2 Un tip defineste o multime de valori si operatiile posibile cu acestea, in C putem defini tipuri , si : da nume unui sir de valori numerice => folosit cand e mai sugestiv de scris un nume decat un numar luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; defineste un tip cu numele enum iuni curs (si e parte din n urnei) implicit, sirul valorilor e crescator incepand cu 0 dar putem specifica si explicit valori (si o valoare se poate repeta) Un tip enumerare e un tip intreg => variabilele valorile enumerare se folosesc ca si intregi enum {D, L, Ma, Mc, J, V, S} zi;    declara tip anonim + variabila zi int nr ore lucru ;    numar de ore pe zi for (zi = L; zi tipuri structuri diferite pot avea campuri numite la fel Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 4 1) toata structura (atribuite, date ca parametru, returnate ca rezultat) 2) accesul la campuri: se face cu sintaxa nume variabila nume camp Punctul e (e un operator postfix) struct student s;    var s; numele complet al tipului: struct student strcpy(s nume, "Stefanovici");    NU! s nume = (e un tablou) s domiciliu = "str Linistei nr 2";    sau malloc + strcpy s medie an = 9 35;    un camp se foloseste ca orice variabila initializarea structurilor: camp cu camp, cu acolade, ca la tablouri struct point { float x, y; } pctl = { 2 5, 1 5 }; Putem scrie direct valori de tip structura ( ) ( nume-tip ) { initializatori }    tip indicat explicit in conversie void draw(struct point p);    declaratie de functie struct point p2;    declara o variabila structura p2 = (struct point) {-1,2};    indica ce tip are valoarea data draw((struct point) { 1 5, 2 5 });    struct data ca parametru Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 5 Structurile fi atribuite in totalitatea lor struct point pl, p2; pl = p2; Structurile fi transmise catre   returnate de functii Pt dimensiuni mari, se prefera transmiterea   returnarea de pointeri Structurile fi comparate cu operatori logici => trebuie comparate individual campurile lor : typedef nume-tip-existent nume-tip-nou; ex typedef double real; => putem alege un nume mai scurt, fara struct - direct in definirea tipului: typedef struct student {  * ceva campuri *  } student t; - sau separat de definirea tipului structura propriu-zis: typedef struct student {  * ceva campuri *  };    defineste tipul typedef struct student student t;    declara un nume pentru el Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 6 Frecvent: accesul la campuri prin intermediul unui pointer la structura: struct student *p;  * p = *  (*p) nota dipl = 9 50; Operatorul e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si () si □ Atentie la ordinea de evaluare ! p->x++ ++p->x *p->x *p->s++ msea insea insea insea mna mna mna mna (p->x)++ ++(p->x) *(p->x) *((p->s)++) Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 7 in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie",  * , *  "decembrie" }; char zile luna = { 31, 28, 31, 30,  * , *  30, 31 };    e preferabila varianta urmatoare struct luna { char *nume; int zile; struct luna luni = {{"ianuarie",31},  * ,*  {"decembrie",31}}; Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 8 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl { char *word; struct wl *next;    struct wl e un tip, incomplet definit    cuvantul: informatia propriu-zisa    pointer la structura de acelasi tip    acum definitia tipului e completa Un arbore binar, avand in noduri numere intregi: typedef struct t tree;    defineste struct t { tipul incomplet tree = struct t int val; tree *left, *right;    foloseste numele din typedef };    aici tipul struct t e complet si echivalent cu tree Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 9 Vrem sa reprezentam mai multe informatii cat mai compact pe biti Ex : o data ca intreg pe 32 de biti: sec, min (0-59): 6 biti, ora (0-23), ziua (1-31): 5 biti, luna (1-12): 4 biti), anul (1970 + 0-63): 6 biti Construim : int data = 39 " 26 | 5 " 22 | 19 " 17 | 17 " 12; (19 5 2009, 17h) Extragem ora: int ora = data " 12 & OxlF; Sau: acces direct la campuri pe biti, fara masti si operatori pe biti struct date t {    alternativa: structura cu campuri pe biti unsigned sec, min : 6;    indica numarul de biti unsigned hour, day: 5;    se permit tipuri intregi unsigned month: 4; unsigned year: 6; } data = {0, 0, 17, 19, 5, 39    17:00:00, 19 05 (1970+39) Putem scrie direct: printf ("70u 70u n" , data, day, data, month); Putem avea campuri fara nume: int: 2;    pe 2 biti sau forta trecerea la memorarea in octetul urmator int: 0; Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 10 Folosite pentru a retine valori care pot avea tipuri diferite Sintaxa: ca la structuri, dar cu cuvantul cheie Lista de campuri reprezinta o lista de variante, pentru fiecare tip: - o variabila structura contine toate campurile declarate - o variabila uniune contine exact una din variantele date (dimensiunea tipului e data de cel mai mare camp) union {   tip uniune, fara nume int i; double r; char *s; } val;    trei variante pentru fiecare tip de valoare enum { iNT, REAL, SiR } tip;    tine minte varianta memorata char s ; if (scanf ("° 031s", s) == 1) { if (isdigit(*s))    incepe cu cifra ? daca da, contine punct ? if (strchr(s, ’ { sscanf (s, "° olf", feval r); tip = REAL; } else { sscanf (s, "° od", feval i); tip = iNT; } else { val s = strdup(s); tip = SiR; } Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 11 Programele se scriu modular, intr-un fisier c se pun functii inrudite (exemplu: un fisier de functii pentru lucrul cu un anumit tip) de tipuri, functii si variabile care trebuie folosite si in alte fisiere se pun intr-un fisier antet h Acesta e inclus de fiecare fisier c care il necesita Fisierul biblioteca c poate fi compilat separat (gcc -c) intr-un o - acesta contine cod masina, dar cu informatii despre numele de functii variabile, pentru a putea fi folosite Programatorul scrie un program main c care include biblioteca h si e compilat impreuna cu codul bibliotecii (e suficient fisierul obiect) Programarea calculatoarelor Curs 11 Marius Minea Tipuri definite de utilizator 12 TDA = un model matematic cu un set de operatii asupra lui => o structura de date + functii care opereaza pe ea => notiunea de din programarea orientata pe obiecte Pentru implementarea TDA in C: - in fisierul h se declara minimul necesar pentru a putea compila programul (pentru structuri, adesea doar un typedef pt pointer la tip) - si declaratii de functii care manipuleaza tipul respectiv -structura tipului si definitiile functiilor: ascunse in implementare ( c) typedef struct node *list t;  * in fisierul h *  typedef struct node {  * in fisierul c cu implementarea *  int info;  * sau si alte campuri *  struct node *nxt; } node t;  * tip vizibil doar in fisierul c *  Utilizatorul, care include doar fisierul h nu are acces la structura interna a tipului (node t); accesul e permis doar prin functii => schimbari in implementarea bibliotecii nu afecteaza programul Programarea calculatoarelor Curs 11 Marius Minea 11 ianuarie 2005 Verificare formala Curs 11 Marius Minea interpretare abstracta 2 O metoda pentru definirea unei a unui program, care poate fi utilizata pentru a analiza programul si a produce informatii despre comportamentul sau in executie [Cousot & Cousot ’77] inspirata din: — analiza fluxului de date sistematizeaza notiunile de proprietati analizate si caracteristicile fundamentale ale metodelor de analiza - semantica denotationala formalizeaza notiunea de a semanticii unui program (corectitudinea e nedecidabila => avem nevoie de aproximare) Verificare formala Curs 11 Marius Minea interpretare abstracta 3 Consideram un limbaj care contine doar intregi si inmultire: e ::= i | e*e Definim semantica printr-o functie care da valoarea unei expresii:  1 : Exp int,  і(г) = i, * 62) = м(е1) * м(е2) Definim o functie de abstractie a : Exp 0, +} : !- daca i 0 — - 0 + si pentru expresii prin tabelul: + 0 -0 0 0 - 0 + La fel se poate introduce operatorul minus unar: - 0 + - + 0 - Verificare formala Curs 11 Marius Minea interpretare abstracta 4 introducem operatia de adunare => abstractia nu mai e precisa + - 0 + 0 - 0 + Apar valori care nu pot fi determinate precis (se pierde precizia) => e necesara introducerea lui T = {-,0,+} => apare din nou notiunea de Similar, la introducerea operatorului de impartire  : nu putem imparti la zero si extindem toate operatiile si la L: ± op x = x op ± = ± Verificare formala Curs 11 Marius Minea interpretare abstracta 5 unui program: un model matematic (formal) al tuturor comportamentelor posibile ale unui sistem de calcul care executa acel program, in interactiune cu orice mediu posibil [Cousot] Semantica unui limbaj de programare: defineste semantica oricarui program Abordare generala: semantica unui program poate fi definita ca solutie a unei (corespunzatoare iteratiei) => toate semanticile unui program pot fi organizate intr-o ierarhie, dupa nivelul lor de Verificare formala Curs 11 Marius Minea interpretare abstracta 6 - secvente de executie (finite sau infinite): descriu in fiecare punct valoarea variabilelor din program - semantica operationala: descrie comportamentul la nivel de stari si tranzitii (ca si automat) - semantica denotationala: descrie rezultatul executiei (inel, neter-minare) - semantica naturala: ca mai sus, ignora aspectul neterminarii Verificare formala Curs 11 Marius Minea interpretare abstracta 7 - abstractia semn - abstractia pe intervale - abstractia poliedrala (infasuratoarea convexa a valorilor) - abstractia octogonala (ecuatii de forma ±x e o abstractie conservatoare Verificare formala Curs 11 Marius Minea interpretare abstracta 9 Fiind data o functie (transformare) in programul f : D D in programul concret, ce corespondent are aceasta in programul abstract ? Raspuns: f# = aofo7 Pentru un element abstract x e A: - producem intai multimea de valori concrete 7(2:) - aplicam functia concreta f fiecarei valori, obsinand o multime de valori (concrete) - abstractizam multimea de valori concrete intr-o valoare abstracta (cu obisnuita posibila pierdere de precizie) Verificare formala Curs 11 Marius Minea interpretare abstracta 10 Semantica unui program e data in general de o ecuatie de punct fix (datorata ciclurilor din program) - am vazut deja ecuatii de punct fix pentru analiza de flux de date Avem: - punctul fix al functiei f in domeniul concret - punctul fix al functiei fs in domeniul abstract - concretizarea punctului fix al lui fs Atunci, ifp E 7(lfp #) Verificare formala Curs 11 Marius Minea interpretare abstracta 11 Problema: daca lantul ascendent in calculul de punct fix are lungime infinita (laticea e de inaltime infinita in raport cu functia transformarea data), nu se poate determina un punct fix intr-un numar finit de pasi while (x >= 0) x = x + 1; Ex analiza codului de mai sus chiar cu intervale Pe de alta parte, "ghicind" intervalul [0,oc) e clar ca acesta e punct fix (si punctul fix minimal) Verificare formala Curs 11 Marius Minea interpretare abstracta 12 Permite eliminarea lanturilor de lungime infinita la calculul de punct fix, in doi pasi: - la inceput, o aproximare mai grosiera a lantului ascendent, care conduce la convergena mai rapida (in numar finit de pasi) - apoi, o revenire la precizie mai buna, printr-un lant de aproximari descendente, spre punctul fix propriu-zis Verificare formala Curs 11 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  5 decembrie 2016 pot descrie comportamentul unui sistem simplu, din fiecare stare s, intrarea a determina starea urmatoare s' Un automat un limbaj (face parte sirul din limbaj?) ex text cu comentarii incheiate corect putem : automate care produc iesiri (in functie de intrare) limbaje (ex elimina comentarii) reprezinta concis automate, deci putem recunoaste siruri cu o anumita structura (ex numar real) in general, dorim sa sau sa daca un sir apartine unui limbaj, siruri dintr-un limbaj astfel de siruri Exista limbaje foarte simple care nu sunt regulate: {anbn | n > 0} paranteze echilibrate {илѵ | w G {a, b}*} {wwR | w G {a, b}*} Automatele finite au numar finit de stari = cuvant, apoi acelasi repetat cuvant, apoi inversat > nu pot numara mai mult de atat Limbajele regulate au proprietatea ( ): Эр G N astfel ca orice cuvant w cu |w| > p (destul de lung) are forma w = xyz cu |y| >1 se repeta un subsir cu > 1 simbol ixvl 0 xykz G L у poate fi repetat arbitrar intre x si z Fie un limbaj regulat si automatul care-l recunoaste Alegem lungimea de pompare p = numarul de stari din automat Fie sirul aia2 am cu m> p, si starile parcurse de automat:  Э1 ^2 3m Qo Ql Q2 • • •  > Qm Avem m + 1 > p stari, deci cel putin o stare se repeta: qs = qt cu s, t Avem limbaje simple care nu sunt regulate =^- trebuie alt formalism Din standardul C: (6 8 4) selection-statement: i f ( expression ) statement if ( expression ) statement else statement switch ( expression ) statement (6 8 5) iteration-statement: while ( expression ) statement do statement while ( expression ) ; for ( expression opt ; expressionopt ; expressionopt ) statement for ( declaration expressionopt ; expressionopt ) statement limbajelor de programare e descrisa prin Exemplu: propozitii in limba engleza (mult simplificat) A good student reads books S NP VP NP —> subst NP det NP VP -> verb VP verb NP noun phrase + verb phrase substantiv cu parte determinanta (art adj) predicat: doar verb predicat: cu complement direct simboluri care apar in stanga —> (sunt inlocuite): simboluri care apar numai in dreapta —> : Orice limbaj e descris prin sale si prin care pot fi combinate acele simboluri 0 descrie cum se obtin sirurile unui limbaj prin ( ) pornind de la un О а unui sir dintr-o gramatica e aplicarea unui care transforma simbolul de start al gramaticii in sirul dat (indicand la fiecare pas si simbolul transformat) e o reprezentare ierarhica a unei derivari, scriind partea dreapta a fiecarei reguli sub partea stanga: S A good student reads books NP VP S -4- NP VP det NP verb NP NP -  " det NP VP - > verb NP a det NP i i 1 reads noun NP - det NP NP - noun 1 1 good noun 1 books NP - -> noun student sirurile de paranteze echilibrate: orice paranteza deschisa are o pereche inchisa o paranteza se inchide dupa inchiderea celor deschise dupa ea S —> e (notatie pentru sirul vid) S (S)S Л( O posibila derivare: s 4 (0) 4 (O)()s 4 (())() )s -4 (()s)s -4 (())s 4 la fiecare pas, am subliniat neterminalul transformat, am indicat regula folosita 4 sau 4 si am colorat in ce se transforma {wwR | w G {a, b}*} S^e S —> aSa S^bSb cuvant+invers (palindrom, lungime para) Notam: litere mari: neterminale; mici: terminale; grecesti: siruri arbitrare 3) gramatici : genereaza reguli de forma A —> a si A —> aB (regulate la dreapta) alternativ: A —> a si A —> Ba (regulate la stanga) dar nu amandoua combinat! 2) gramatici reguli: A —> 7 stanga: neterminal; dreapta: sir arbitrar 1) gramatici reguli: аА 3 —> orf 3 A e rescris doar cand apare intre а si  3 ф e (nevid), sau S —> e doar daca S nu apare in dreapta 0) gramatici nerestrictionate (orice reguli de rescriere) limbaje recursiv enumerabile (recunoscute de o masina Turing) O gramatica formala G e formata din: E: o multime de simboluri (din care se formeaza sirurile limbajului)  V: o multime de simboluri , N П E = 0 (folosite doar in descrierea gramaticii) P: o multime de , de forma (E и  Ѵ)* Ѵ(Е U  V)* -ЯЕи  V)* un neterminal N, eventual intr-un context (sir in stanga dreapta) e rescris cu un sir de terminale si neterminale S G N: un Limbajul definit de G e format din toate sirurile de care se pot obtine din S aplicand oricate reguli dupa John Backus (dezvoltatorul limbajului FORTRAN) si Peter Naur (ALGOL 60) (fiecare: premiul ) Notatie frecvent folosita pentru gramatici independente de context foloseste pentru definitie si pentru alternativa Neterminal ::= rescrierel i rescriere2 | | rescriereN uneori folosite cu extensii: element-optional simbol (steaua Kleene) pentru repetitie simbol (plus) pentru repetitie cel putin odata paranteze pentru gruparea elementelor Stmt ::= ExpStmt | ifStmt | WhileStmt | Block ExpStmt ::= expr ; ifStmt ::= ( expr ) Stmt Stmt | ( expr ) Stmt WhileStmt :: = ( expr ) Stmt Block ::= { Stmt* } Problema: cu care se potriveste ? (x > 0) (y > 0) x = 0; У = 0; Gramatica e exista siruri cu mai multi x > 0 у > 0 nimic (arbori sintactici) x > 0 x=0 y=0 у >0 y=0 x=0 nimic interpretarea corecta interpretare incorecta (trebuie eliminata) Pentru a dezambigua gramatica, trebuie rescrisa: distingem intre un , care are un , fara Cum e asociat cu cel mai apropiat , ramura e (definim echilibrate restul de instructiuni) Stmt ::= BalancedStmt | UnBalancedlf BalancedStmt ::= ExpStmt | WhileStmt | Block | Balancedlf ExpStmt ::= expr ; WhileStmt ::= ( expr ) Stmt Block ::= { Stmt* } Balancedlf ::= ( expr ) BalancedStmt Stmt UnBalancedlf ::= ( expr ) Stmt vl) E ::= num i E + E i E - E i E * E si aici avem nu e precizata precedenta operatorilor v2) Rescriem pe 3 nivele de E ::= T | E + T | E - T T::=F|T*F|T F F ::= num | ( E ) Exemplu: 2 * (5-3) v3) Eliminam si (E apare in stanga productiilor lui E) E ::= T RestE RestE ::= e | + T RestE | - T RestE T ::= F RestT RestT € | * F RestT |   F RestT F ::= num | ( E ) nu necesita paranteze, subexpresiile reies din structura * Expresii : E ::= num Op ЕЕ Op ::=+ - *   2 + *-2+345 = (2- (3+4)) *5 A 3 4 * Expresii E ::= num E E Op , Op ::=+ - *   2 7 A 2 4 5 - - 7 * = (2- (4-5)) *7 A 4 5 Scrierile se pot obtine prin traversarea arborelui expresiei: in : intai operatorul, apoi subexpresiile (in acelasi fel) in : intai subexpresiile (in acelasi fel), apoi operatorul 10 ianuarie 2005 Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 2 - pentru probleme de optimizare - alegerea optimului local in scopul de a obtine un optim global (nu e valabila universal; uneori, e doaer o euristica) Exemple: arborele minim de cuprindere intr-un graf - cand nu se poate determina sigur pasul care conduce la succes - e necesara o cautare exhaustiva in spatiul starilor - cautare recursiva (in adancime), cu revenire in caz de esec - rezolvarea unei probleme prin descompunerea in probleme mai mici - tipic: structura recursiva (exemplu: quicksort) Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 3 Fie matricile Am,n (m linii, n coloane) si Bn^p (n linii, p coloane) Pentru a calcula produsul avem nevoie de m • n • p inmultiri for (i = 0; i pentru N matrici Ag • A± • • produsele individuale pot fi calculate in diverse ordini ex pt А1Одоо, B100,5, ^5,50: (AB)C: 10 • 100 • 5 + 10 • 5 • 50 = 5000 + 2500 = 7500 inmultiri A(BC): 100 • 5 • 50 + 10 • 100 • 50 = 25000 + 50000 = 75000 inmultiri Care e ordinea calculelor pt numar minim de inmultiri ? Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 4 Subproblema: Care e numarul F(n) de grupari posibile de paranteze ? Solutie: relatie recursiva: pe ce pozitie 1 nr minim de inmultiri in Aj • • Ak e (cu separare inainte de Aj): W = 0, mik = min^j^m^j-i + m^k + djdjdj, {Aj e matrice dj x di+1) => calculul se poate face completand tabloul global double m[N] [N]; si tabloul int p[N] [N]; cu pozitia la care se face ultima inmultire for (c = 1; c i; ) {  * pt toate pozitiile intermediare *  double v = d[i] *d[j] *d[k] +m[j] [k] ; v+=m[i] [—j] ; if (v 1 descompuneri posibile Domeniu de aplicatie: in special probleme de optimizare - cu proprietatea de descompunere optimala optimal substructure (solutia optima a problemei contine solutii optime la subprobleme) - de regula un tablou pentru cost + unul pentru a retine solutiile - consumul de memorie: adesea semnificativ (patratic sau mai mult) Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 6 Una din sarcinile de rezolvat: in ce ordine se rezolva subproblemele (se completeaza elementele tabelului) ? Adesea: ordine naturala (ex de la indici mici) => program usor de scris Dar, nu intotdeauna e evident => abordarea recursiva e mai naturala Calculul combinarilor: pt 0 daca valoarea a fost calculata, o returneaza; daca nu, o calculeaza recursiv si o memoreaza inainte de a o returna - Calculul recursiv cu memoizare: mai natural de scris; mai eficient daca pentru rezultatul cerut nu trebuie rezolvate toate subproblemele - Calculul de jos in sus: cod mai eficient (fara apeluri de functii), dar rezolva exhaustiv toate subproblemele (chiar nenecesare) Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 8 O multime de chei trebuie aranjate intr-un arbore binar de cautare (cheile din subarborele stang c[i]) c[i] = m; Varianta 2: obiecte unice; c Ed] Ei]: cost max pt dim d, obiecte 0 І for (d = 1; d lEi] EJ-1]) { 1ЕІ] Ej]=lEi-l] EJ]; d[i][j]=l; } else { 1 Ei] Ejl = l[i] [J-l] ; dEi] EJ] = 2; } Programarea calculatoarelor 2 Curs 11 Marius Minea Programare dinamica 11 Se dau doua siruri de lungimi m si n Sa se determine costul minim al operatiilor de editare necesare pentru a transforma un sir in celalalt, prin adaugarea   stergerea   schimbarea unui caracter (Obs: schimbarea are sens daca costul primele j din у *  for (i = 0; i = 0; —k, —i) { c[i][k] = DBL-MAX; for (j = k; —j > i; ) { double m = w(i,j,k) + + c [ j ] [k] ; if (m ng Q( (n)) daca timpul de rulare este > c (n), pt n > ng se studiaza pentru cazul cel mai defavorabil si cel mediu - vom rationa despre corectitudinea algoritmilor folosind invarianti Utilizarea si programarea calculatoarelor Curs 11 Marius Minea Sortare si cautare 3 sa generam un tablou de numere aleatoare pe care sa le sortam, int rand(void) ;  * in stdlib h *  genereaza numar pseudoaleator intre o si rand max void srand(unsigned seed); seteaza starea initiala pentru generatorul de numere pseudoaleatoare OBS: in absenta apelului la srand, functia rand va repeta aceeasi secventa generata pentru fiecare rulare - se poate initializa generatorul in functie de ceas (time h): time t tiine(time t *timer); (time t e unsigned long) ret nr de secunde trecute de la o data origine (UNiX: 1 ian 1970) daca param, pointer e nenul, valoarea se stocheaza si la acea adresa const int N=100; const int MAX=1000; int i, a[N] ; srand( (int) tiine (NULL) ) ;  * initializeaza generatorul *  for (i = 0; i = i; j—)  * if (a[j] preferabil daca dimensiunea elementelor este mare invariant: acelasi ca la bubblesort: dupa iteratia i (1 = i && a[r] >= p) r—; if (1 i) quicksort (a, i, r); if (1 void main(void) unsigned m, lo = 0, hi = (1 " 10) - 1; printf("Ganditi-va la un numar intreg intre 0 si ° od n", hi); do { m = (lo + hi) " 1; printf ("Numarul e mai mare decat ° od ? (d n) ", m) ; if (tolower (getcharO) == ’d’) lo = m+1; else hi = m; while (getcharO != ’ n’); } while (lo a[m]) l=m+l; else r=m; int m = (l+r) 2; if (v>a[m]) return bsrch(v, a, m+1, r); else if (v==a[l]) return 1; else return -1; return bsrch(v, a, 1, m) ; } else if (v==a[l]) return 1; else return -1; void *bsearch(const void *key, const void *base, size t nmemb, size t size, int (*compar)(const void *, const void *)); Utilizarea si programarea calculatoarelor Curs 11 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  11 decembrie 2017 Un arbore e un conex = drum intre orice 2 noduri (din 1 sau mai multi pasi) E compus din si (muchii) un arbore cu n noduri are n — 1 ramuri (demonstram prin ) imagine: http:  en wikipedia org wiki File:Tree graph svg Demonstram prin inductie: n = 1 e trivial (un nod fara muchii) Fie multimea intr-un arbore cu n > 1 noduri Cum arborele e aciclic, un drum are doar noduri distincte (altfel, un drum v, v7- cu v, = Vj e un ciclu) un drum are cel mult n noduri numarul de drumuri e => exista un drum de v(1 v,2 ѵ,к Atunci, v(1 e legat doar de v 2, altfel, Va tV^v^ v,k ar fi mai lung! nodul v(1 si muchia (v(1, v,2) Graful obtinut ramane conex (niciun drum in graful initial nu are v(1 ca nod interior) E evident si aciclic (nu am adaugat muchii noi), deci e un arbore Din ipoteza de inductie, avand n — 1 noduri, are n — 2 muchii, deci graful initial avea cu un nod si o muchie in plus, q e d incercati sa demonstrati separat si: Un graf cu n noduri are n — 1 muchii Un graf cu n noduri are n — 1 muchii Deobicei identificam un nod anume numit si muchiile in acelasi sens fata de radacina Orice nod in afara de radacina are un unic Un nod poate avea mai multi (f 7) Nodurile fara copii se numesc noduri imagine: http:  en Wikipedia org wiki File:N-ary to binary svg Arborii sunt un mod natural de a reprezenta structuri sistemul de fisiere (subarborii sunt cataloagele) arborele sintactic intr-o gramatica (ex expresie) ierarhia de clase in programarea orientata pe obiecte fisierele XML (elementele contin alte elemente) E T T * F 1 1 1 1 i 2 3 Ordinea dintre copii poate conta (ex arbore sintactic) sau nu Arborii neordonati cu 2 - 4 noduri: n n n n (argumentati: de ce sunt 12 variante liniare cu 4 noduri?) Exista n" 2 arbori neordonati cu n noduri ( ) Demonstratie frumoasa: reprezentand un arbore ca sir de n — 2 numere de la 1 la n (cititi optional despre ): sterge numarul minim, scrie nr la care era legat, pana raman 2 noduri imagine: http:  en Wikipedia org wiki File:Cayley’s formula 2-4 svg Un arbore e un cu 0 sau mai multi => o de subarbori (frunzele au lista vida) in functie de problema, nodurile contin in exemplu: toate nodurile au informatie de acelasi ’a tree = T ’a * ’a tree list = T(’S’,[T(’A’,[T(’a’,[])]); T(’b’,[]); T(’B’,[T(’S’, [T(’a’,[])]) ;T(’b’,[])])] ) S  l  A b В i    a S b Definitia data: buna cand arborele totdeauna exista (ex : expresie) Uneori, arborele poate fi vid (ex : pentru reprezentarea de multimi) Putem defini atunci: Un arbore e fie arborele sau un cu mai multi =^- extindem tipul anterior cu o valoare pentru arborele vid tip nou = tip vechi (J{valoare-speciala} ’a option = None | Some ’a indica in ML o valoare de tipul ’a care poate eventual lipsi lucram cu valori de tipul ’a tree option None sau Some t, cu t de tip ’a tree definit anterior: ’a tree = T ’a * ’a tree list i None -> i Some T(r, tl) -> Uneori, nu avem informatie utila decat in nodurile frunza: reprezentam explicit varianta de nod frunza ’a tree = L ’a | T ’a tree list => arborele e echivalent cu o (lista de liste) [a, [b, c], [d, [e, f], g], h] dar o lista de liste trebuie sa fie uniforma pe nivele (acelasi tip) T [L ’a’; T [L ’b’; L ’c’]; T [L ’d’; T [L ’e’; L ’f’]; L ’g’]; L ’h’] imagine: R M Keller: Computer Science: Abstraction to implementation intr-un arbore binar, fiecare nod are cel mult doi copii, identificati ca fiul stang si fiul drept (oricare ambii pot lipsi) un arbore binar e fie: arborele vid un nod cu cel mult doi subarbori ’a bintree = Nil | T ’a bintree * ’a * ’a bintree instantiind pentru noduri intregi: inttree = Nil | T inttree * int * inttree Un arbore binar de inaltime n are cel mult 2n+1 — 1 noduri subarborele stang: T (T(Nil, 2, Nil), 7, T(T(Nil, 5, Nil), 6, T(Nil, 11, Nil))) subarborele drept: T (Nil, 5, T(T(Nil, 4, Nil), 9, Nil)) imagine: http:  en wikipedia org wiki File:Binary tree svg Memoreaza valori sortate in ordine: pentru fiecare nod, subarborele stang are valori mai mici, subarborele drept are valori mai mari Pot fi folositi pentru a reprezenta Cautarea: recursiv in subarborele potrivit x = srchx = i Nil -> false i T (left, v, right) -> v = x || srchx ( x expresii * pre(     ) 5 2 +     3 4 Parcurgere in 4 5 => expresii post(     ) 7 * 2 - 4 5 * - 2 pre(   x ) 5 3 4 *-2 + 345 2 post(     ) - 7 * 4 5 2 4 5 - - 7 * Functia primeste si returneaza numar folosit la etichetare (daca un arbore primeste n, primul nod va fi etichetat cu n+l) Diferenta intre numarul returnat si primit e nr de noduri din arbore 1 П2 v ni — (n+l) = nr nodun Astang) n? — ni = nr noduri(Adrept) п Л2 V ni — п = nr noduri(Astang) п2 - (лі + 1) = nr noduri(Adrept ') ж В К D Л f J Е С ni — п = nr noduri(Astang) п? — ni = nr noduri(Adrept) ж В К D л т J Е С Tipuri definite de utilizator 21 decembrie 2004 Un tip defineste o multime de valori si operatiile posibile cu acestea Adeseori e nevoie de alte tipuri (mai complexe) decat cele de baza, in C se pot defini tipuri enumerare, structura si uniune cu sintaxa: cuvantcheie opinurne tip specificatie tip opt lista declaratori ; unde cuvant cheie ::= enum | struct | union opt nume tip: pt referire ulterioara (prefixat cu enum, struct, union) optJistaodeclaratori: pot fi declarate obiecte de tipul respectiv - opt nume tip e intr-un spatiu de nume diferit de cel comun pentru variabile, tipuri si functii E mai clar sa folosim totusi nume diferite Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: enum opinurne tip { lista constante } opt lista declaratori ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - acelasi nume de constanta nu poate fi folosit in doua enumerari diferite - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante int ore lucru[Z]; enum zile sapt {D, L, Ma, Mc, J, V, S} zi; for (zi = L; zi e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume cainp Operatorii si -> au precedenta cea mai ridicata, ca si O si [] Atentie la ordinea de evaluare i p->x++ inseamna (p->x)++ ++p->x inseamna ++(p->x) *p->x inseamna *(p->x) *p->s++ inseamna *((p->s)++) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume lunaC12] = { "ianuarie", , "decembrie" }; char zile luna = { 31, 28, 31, 30, , 30, 31 };  * e preferabila varianta urmatoare *  typedef struct { char *nume; int zile; } tip luna; tip luna luni = { {"ianuarie", 31}, , {"decembrie", 31} }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator Tipuri definite de utilizator 10 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {  *o lista de cuvinte *  char *word;  * informatia propriu-zisa *  struct wl *next;  * pointer la acelasi tip de structura *  }; Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  * declaratie incompleta *  struct t { int val; tree *left, *right;  * foloseste numele din typedef *  }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Se pot declara campuri intregi cu un numar specificat de biti => Testarea setarea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : int-const ; | : int-const ; struct packet { int : 2;  * primii doi biti nu intereseaza *  int error: 1;  * un bit, semnalizeaza eroare *  int status: 3;  * un camp pe 3 biti *  int : 0;  * forteaza alinierea la octetul urmator *  int seq no: 4;  * numar de secventa pe 4 biti *  } pkt; if (pkt error) { } else if (pkt status == 5) { } else pkt seq no++; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 11 Tipuri definite de utilizator 12 Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { iista c3mpuri } opt lista declaratori ; Lista de campuri este insa o lista de variante: - o variabila structura contine toate campurile declarate - o variabila uniune contine exact una din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune nu contine informatii despre varianta reprezentata - acest lucru trebuie memorat explicit in program (in alta variabila) Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) - date suplimentare pentru identificatori (nume) si constante (valoare) enum tok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , COMMa, }; typedef union { char *id;  * sir de caractere pentru identificator *  int ival;  * valoare pentru constanta intreaga *  float fval;  * valoare pentru constanta reala *  } lexvalue; enum tok token; lexvalue iv; switch (token) { case iDENT: printf("%s", iv id); break; case iNUM: printf("%d", iv ival); break; case FNUM: printf("%f", iv fval); break; } Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Verificarea programelor in practica 18 ianuarie 2005 - Verificarea programelor Java (Pathfinder, ESC Java, Bandera) - Proof Carrying Code - Combinatii cu analiza statica Verificare formala Curs 12 Marius Minea Unul din primele eforturi de a verifica cod in limbaje de programare uzuale initial,(Java PathFinder 1 0): traducere din Java in PROMELA (Spin) - similaritati de limbaj: tratarea de creare dinamica de obiecte, thread-uri - dar: lipsesc alte facilitati (numere reale); necesita sursa completa Java PathFinder 2 0: verificator de sine statator, scris in Java [G Brat, K Havelund, S Park, W Visser ’00] Arhitectura generala Model checking cu reprezentare explicita a starilor -tehnica uzuala pentru reprezentarea starilor de dim mari (structuri): fiecare val structurala stocata doar o data; inlocuita cu un cod intreg Masina virtuala Java proprie pentru model checking - + algoritmi de explorare (comanda pasi inainte inapoi in JVM proprie) - mediu nedeterminist: prin metode speciale captate de JVM Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 3 Verificarea programelor in practica Tehnici folosite (cont ) - pentru construirea abstractiilor din program (prin slicing') - pentru identificarea conditiilor de reducere cu ordonare partiala folosind un demonstrator de teoreme, SVC (Stanford Validity Checker) , pentru detectarea potentialelor conditii de eroare - accesul concurent neprotejat la variabile comune - accesarea in ordine diferita a semafoarelor Performanta; sisteme verificate - scris in Java, de lOx mai lent ca Spin; viteza: n-1000 stari secunda - un agent de control pentru operarea in spatiu - un fragment de sistem de operare distribuit (14 clase, 1 kloc) Verificare formala Curs 12 Marius Minea Prin transformare la nivelul sursa, rezulta alt program Java care opereaza cu predicatele abstracte Abstractia e specificata ca si anotatie speciala: class Abstract; Abstract remove(x)    abstractizeaza x Abstract addBooleanC'xO", x == 0)    adauga predicatul x == 0 Se pot abstractiza si predicate peste mai multe clase: Abstract addBooleanC'xGTy", a x > B y); - genereaza un predicat pentru fiecare pereche de obiecte instantiate din clasele A si В - posibila explozie a numarului de predicate Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 5 Verificarea programelor in practica ESC — Extended Static Checking; initial pentru Modula 3, apoi Java - nu este un model checker, ci foloseste verificari prin - poate detecta erori de genul: referinte nule, depasiri de indici - pentru proprietati mai complexe, se folosesc adnotari (invarianti, preconditii, postconditii, conditii de nul nenul, etc ) - pentru verificarea se foloseste un demonstrator de teoreme (Simplify) - permite verificarea modulara, separat pentru fiecare metoda - modulele cu sursa indisponibila: suplinite prin fisiere de specificatii Analizoare statice similare exista si pentru C (fost lint, acum splint) Un verificator modular pentru programe Java - un front-end pentru simplificarea programului (program slicing) - o biblioteca de abstractii frecvent folosite - eventual restrictia modelului la numar mic de instante de module (utilizatorul specifica pt fiecare variabila abstractia dorita) - un generator pentru un model finit intr-un format generic (limbaj cu guarded commands, tradus usor in alte limbaje de specificare) - interfete cu verificatoare uzuale (SMV, Spin, demonstratorul PVS) - un limbaj de specificare, si suport pt formule pe baza de tipare Verificare formala Curs 12 Marius Minea Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 7 Verificarea programelor in practica [Necula & Lee ’96, Necula ’97] - O metoda pentru executia sigura a codului lipsit de nivel cert de incredere (untrusted code) Exemplu: aplicatie via internet - Consumatorul de cod defineste niste reguli de siguranta - Furnizorul livreaza codul insotit de o demonstratie formala ca satisface regulile de siguranta - Consumatorul foloseste un verificator simplu de demonstratii pentru a stabili validitatea codului si demonstratiei primite - Compilator cu certificarea codului (certifying compiler) genereaza cod nativ cu anotatii (ex invarianti) - Generator de conditii de verificare (VCGen) VC — predicat a carui validitate garanteaza executia sigura - Generator de demonstratii (pornind de la VC) - Un verificator de demonstratii: valideaza corespondenta intre codul si demonstratia primita (eventual: asistat de un VCGen identic cu cel anterior) Verificare formala Curs 12 Marius Minea Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 9 Verificarea programelor in practica 10 - Notiunea de VC: legata de regulile pentru corectitudinea programelor, bazate pe preconditii si postconditii [Floyd ’67] - VC nu este neaparat weakest precondition (poate fi mai simpla, mai usor de exprimat si demonstrat) for (i = 0; i 0 premisa i > l -h> s : int postconditie i : simplu pt consumator; incredere doar in verificator - Procedeu rezilient la interventii: orice modificare a codului sau a demonstratiei e detectata (daca nu, programul, chiar modificat, satisface conditiile de siguranta) - Verificarea se face static, o singura data: permite executia eficienta fara introducerea de teste la rulare - Permite siguranta absoluta in compilator, si chiar depanarea acestuia in procesul de dezvoltare Verificare formala Curs 12 Marius Minea Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 11 Verificarea programelor in practica 12 [Necula et al ’01J: programe C corecte dpdv al tipurilor - combinatie de inferenta a tipurilor si verificare la rulare - inferenta tipurilor pt a demonstra ca o portiune cat mai mare din cod este type-safe - inserarea de teste la executie in restul programului pentru a asigura corectitudinea accesului la memorie - ideea de baza: extinderea sistemului de tipuri cu pointeri safe, seq (pt tablouri) si DYNAMiC - introducerea de campuri suplimentare (baza si lungime) pentru pointerii care nu sunt safe - factor de incetinire: 1-2 (fata de 10-100 pt Purify) - analiza permite si descoperirea de erori Verificare formala Curs 12 Marius Minea Contextul: lightweight and semi-formal methods: sacrifica parte din garantii pentru a creste abordabilitatea si aplicabilitatea practica Metacompilation [Engler et al ’00]: pt erori in sisteme de operare - reguli la nivel inalt bine stabilite (ex "variabila x protejata cu semaforul s", "intreruperile trebuiesc reactivate") => definirea unei meta-semantici accesibile compilatorului - regulile specificate ca automate care tranzitioneaza la analiza sintactica a unui model (pattern) relevant din sursa - un compilator C augmentat aplica aceste extensii la analiza semantica (propagare prin graful de control, local sau global) - rezultate: sute de erori in Linux, OpenBSD, Exokernel, etc Proiect complementar: extragerea automata de modele din sursa, prin slicing (tot pentru sisteme de operare) - modelele sunt analizate apoi cu un model checker Verificare formala Curs 12 Marius Minea Aplicatii Tabele de dispersie Aplicatii Tabele de dispersie 2 - relatii matematice pentru cazul cel mai defavorabil (uneori si mediu, mai rar: cel mai favorabil) - de regula, nu timpul fizic, ci numarul de operatii de un anumit tip (ex pt sortare: numarul de comparatii, numarul de interschimbari) - prin rularea programelor pe diverse seturi de date (aleatoare sau cu anumite proprietati), si masurarea timpilor de executie Discutam: - functii pentru generarea de numere (pseudo)aleatoare - functii legate de masurarea timpului Programarea calculatoarelor 2 Curs 12 Marius Minea Tipuri definite pentru reprezentarea timpului: clock t si time t (sunt de fapt tipuri aritmetice, de ex unsigned sau unsigned long) clock t clock(void); returneaza timpul scurs de la lansarea programului, in unitati de ceas date de constanta Clocks per sec (in standardul POSiX, 1 milion) e o aproximatie dependenta de granularitatea ceasului de timp real poate interveni depasire (pe sistem de 32 de biti, dupa cca 72 min ) time t timeCtime t *timer); returneaza o valoare aritmetica reprezentand data ora curenta (in UNiX, numarul de secunde trecute de la 1 ian 1970 UTC) daca argumentul pointer e nenul, valoarea e stocata si la acea adresa double difftime(tiine t timel, time t timeO); returneaza diferenta exprimata in secunde, ca double Pentru reprezentari descompuse (zi ora min  etc ): tipul struct tm (vezi detalii in standard) Programarea calculatoarelor 2 Curs 12 Marius Minea Aplicatii Tabele de dispersie 3 Aplicatii Tabele de dispersie Numerele generate sunt aleatoare (de fapt deterministe, bazate pe un algoritm, dar cu distributie cat mai uniforma) (numere cu adevarat aleatoare ar trebui sa fie bazate pe fenomene fizice, ex aruncarea unei monede sau descompunerea unor particule) int rand(void); returneaza un numar pseudoaleator intre 0 si rand max (min 32767) pt un numar aleator intre 1 si N putem folosi 1 + randO 7, N void srand(unsigned int seed); reinitializeaza generatorul de numere pseudoaleatoare cu valoarea data urmatorul numar va fi generat de randO pornind de la aceasta valoare fara apelarea ei, doua rulari genereaza acelasi sir de valori cu randO se poate folosi de ex cu srand(unsigned)time(NULL)); - pentru a unui obiect cand acesta nu are o valoare numerica de identificare utilizabila direct ca indice intr-un tablou - ideea: gasirea unei functii h cu o valoare numerica unica pentru fiecare obiect considerat, intr-un domeniu restrans (utilizabil ca indice) => fiecare obiect x e memorat intr-un tablou la indicele h(x) - matematic: o functie partiala h: D -+ V, unde D e domeniul tuturor obiectelor posibile, iar domeniul de valori V e 0,1 N- 1 - ex pt compilator: D e multimea tuturor identificatorilor - practic, | >| >> |V'|, deci h nu poate fi injectiva pe D, dar avem nevoie de valori distincte doar pt submultimea Du c D a obiectelor efectiv utilizate (ex identificatorii dintr-un anumit program C) - se cauta functii de dispersie (hash functions) cu proprietati cat mai bune (distributie uniforma => probabilitate mica de valori egale) Programarea calculatoarelor 2 Curs 12 Marius Minea Programarea calculatoarelor 2 Curs 12 Marius Minea Aplicatii Tabele de dispersie 5 Aplicatii Tabele de dispersie - functii simple, calculate rapid, folosind (aproape) toate caracterele - adesea cu deplasari pe biti (in loc de inmultiri, si pt uniformizare) Exemple pentru siruri (char *s; ien=strien(s); parcurs secvential) for (h=len; len—;) h = ((h"7) " (h"27)) " *s++;  * Knuth *  for (h=5381; c=*s++; ) h += (h " 5) + c;  * Bernstein *  for (h=0; c=*s++; ) h = (h"6) + (h"16) - h + c;  * SDBM *  Pentru alte obiecte: calcule cu intregii obtinuti grupand octetii cate 4 in toate cazurile: valoarea finala luata modulo dimensiunea tabloului - inseram elementul la indicele respectiv, si Ti cautam tot acolo si functiile bune au (valori egale pt obiecte diferite) => trebuie rezolvate (dezambiguate) pentru a permite regasirea corecta - la ce indice inseram cautam elementul daca la h(x) se gaseste altul? (closed hashing) - daca la indicele idx=h(x) se gaseste alt obiect y, se cauta succesiv dupa o anumita regula: secvential (idx++), liniar (idx+=i), cu a doua functie (idx+=h2(x)), pana se gaseste obiectul sau o intrare vida - nu pot contine mai multe obiecte decat dimensiunea tabloului => la depasire, obiectele trebuie redistribuite intr-un tablou mai mare - la stergere, intrarea in tablou trebuie marcata "sters", nu "vid", pentru a permite cautarea corecta (pana la gasire sau "vid") (open hashing) - o intrare in tablou: de obiecte cu aceeasi valoare pentru h => hashing + cautare liniara in lista (scurta pentru functii bune) - necesita alocare dinamica pentru elementele listei (v exemplu) - si aici, tablou cu dimensiune cel putin comparabila cu nr de obiecte Programarea calculatoarelor 2 Curs 12 Marius Minea Programarea calculatoarelor 2 Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 8 ianuarie 2004 • tip de date: multimea valorilor pe care le poate lua o variabila - fiecare tip de date are definiti anumiti operatori • functiile   procedurile pot fi vazute ca o extindere a operatorilor Ex : concatenarea a doua siruri; inmultirea a doua matrici (exista chiar ca operatori in limbaje mai bogate in tipuri) • tip de date abstract: un model matematic + operatii pe acel model Ex : tipul multime (cu test de membru, reuniune, intersectie) • structura de date: colectie de variabile (posibil de tipuri diferite), pentru implementarea tipurilor de date abstracte intr-un program Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 3 Tipuri de date abstracte Stive Cozi - o lista (un sir) in care elementele sunt adaugate si extrase la acelasi capat, in ordinea inversa introducerii (LiFO - last in, first out) - denumire inspirata din realitate (ex o stiva de carti) init(stiva)  * * initializeaza stiva *  empty (stiva)  * testeaza daca stiva e goala *  push(stiva, element)  * pune pe stiva *   * pop si top necesita ca preconditie o stiva nevida *  pop(stiva) : element  * extrage si returneaza varful stivei *  top(stiva) : element  * returneaza varful stivei *  full(stiva)  * testeaza daca stiva e plina *  #define MAX 100  * dimensiunea maxima a stivei *  typedef int elem t  * sau orice alt tip dorit *  typedef struct s { elem t t[MAX]; int sp;  * indicele stivei *  }• stack; void init(stack *s) { s->sp = 0; } int empty(stack *s) { return s->sp == 0; } void push(stack *s, elem t e) { if (sp t[s->sp++] = e; } elem t pop(stack *s) { return s->sp ? s->t[—s->sp] : 0; } elem t top(stack *s) { return s->sp ? s->t[s->sp-l] : 0; } int full(stack *s) { return s->sp == MAX; } Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi Tipuri de date abstracte Stive Cozi typedef int elem t; typedef struct { elem t *base, *sp, *lim; }• stack; void init(stack *s) { s->base = s->sp = s->lim = NULL; } int empty(stack *s) { return s->sp == s->base; } void push(stack *s, elem t e) { if (s->sp == s->lim) { elem t *p=realloc(s->base,(s->sp-s->base+64)*sizeof(elem t)); if (!p) return;  * eroare, memorie insuficienta *  s->sp += p - s->base; s->lim += (p - s->base) + 64; s->base = p; *s->sp++ = e; elem t pop(stack *s) { return (s->sp!=s->base) ? *—s->sp : 0; } elem t top(stack *s) { return (s->sp!=s->base) ? *(s->sp-l) : 0; } Varianta cu dealocarea memoriei in pop() (simetric cu push): elem t pop(stack *s) { elem t e = (s->sp!=s->base) ? *—s->sp : 0; if (s->lim - s->sp == 64) {  * limita pt dealocare *  p = realloc(s->base, (s->sp-s->base)*sizeof(elem t)); s->lim = s->sp += p - s->base; s->base = p; return e; Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi Tipuri de date abstracte Stive Cozi == faptul ca detaliile de implementare sunt ascunse de utilizator Pentru folosirea stivei, ar fi suficient un fisier cu typedef int elem t;  * trebuie specificat tipul elementului *  typedef struct s stack;  * tip incomplet *  void init(stack *s); int empty(stack *s); void push(stack *s, elem t e); elem t pop(stack *s); int full(stack *s); implementarea: intr-un fisier compilat separat, invizibil utilizatorului -trebuie recompilatinsa daca schimbam definitia elementului - o solutie: stiva de pointeri void *, nu obiecte propriu-zise Din apelurileincuibate de functii se revinein ordine inversa fata de apel => stiva este foarte naturala pentru implementare - arhitectura procesorului: registru pentru varful stivei - pe stiva se pun in ordine: parametrii, apoi adresa de revenire, apoi in functie se creeaza variabilele locale => variabilele locale dispar la revenirea din functie = cu e corecta returnarea adresei unei variabile locale Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 9 - o lista (un sir) in care inserarea se face la un capat, si extragerea la celalalt, in ordinea introducerii elementelor (FiFO = first in, first out) init(coada)  * initializeaza coada *  empty(coada)  * testeaza daca coada e goala *  enqueue(coada, element)  * adauga la coada, daca nu e plina *  dequeue(coada) : element  * extrage din coada nevida *  full(coada)  * testeaza daca coada e plina *  Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 10 #define MAX 100  * dimensiunea maxima a cozii *  typedef int elem t  * sau orice alt tip dorit *  typedef struct { elem t t[MAX]; int head, tail;  * inserare la tail, extragere de la head *  }• queue; void init(queue *q) { q->tail = q->head = 0; }• int empty(queue *q) { return q->head==q->tail; } void enqueue(queue *q, elem t e) { if (((q->tail+l)7,MAX) == q->head) return;  * coada plina *  q->t[q->tail++] = e; q->tail 7,= MAX; elem t dequeue(queue *q) { if (q->head==q->tail) return 0;  * coada vida *  { elem t e = q->t [q->head++] ; q->head 7"= MAX; return e; } int full (queue *q) { return ((q->tail+l)7,MAX) == q->head; } Utilizarea si programarea calculatoarelor Curs 12 Marius Minea 21 decembrie 2004 Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 2 Un tip defineste o multime de valori si operatiile posibile cu acestea Adeseori e nevoie de alte tipuri (mai complexe) decat cele de baza, in C se pot defini tipuri enumerare, structura si uniune cu sintaxa: cuvant cheie opt nume tip specificatie tip optlistadeclaratori ; unde cuvant cheie ::= enum | struct | union opt nume tip: pt referire ulterioara (prefixat cu enum, struct, union) opt lista declaratori: pot fi declarate obiecte de tipul respectiv - opt nume tip e intr-un spatiu de nume diferit de cel comun pentru variabile, tipuri si functii E mai clar sa folosim totusi nume diferite Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 3 Folosite pentru a da nume simbolice unui sir de valori numerice Sintaxa: enum opt nume tip { lista constante } opt lista declaratori ; - constantele pot avea specificate valori (si o valoare se poate repeta) enum luni curs {ian=l, feb, mar, apr, mai, iun, oct=10, nov, dec}; - implicit, sirul valorilor e crescator cu pasul 1, iar prima valoare e 0 - acelasi nume de constanta nu poate fi folosit in doua enumerari diferite - tipurile enumerare sunt tipuri intregi => variabilele enumerare se pot folosi la fel cu variabilele intregi - cod mai lizibil decat prin declararea separata de constante int ore lucru ; enum zile sapt {D, L, Ma, Mc, J, V, S} zi; for (zi = L; zi e echivalent cu indirectarea urmata de selectie: pointer->nume camp e echivalent CU (*pointer) nume camp Operatorii si -> au precedenta cea mai ridicata, ca si () si □ Atentie la ordinea de evaluare ! p->x++ inseamna (p->x)++ ++p->x inseamna ++(p->x) *p->x inseamna *(p->x) *p->s++ inseamna *((p->s)++) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 8 in C, tipurile agregat pot fi combinate arbitrar (tablouri de structuri, structuri cu campuri de tip tablou, etc ) Tipurile trebuie definite in asa fel incat sa grupeze logic datele Ex : daca doua tablouri au acelasi domeniu pt indici si datele de la acelasi indice sunt folosite impreuna, e preferabila gruparea in structura: char* nume luna = { "ianuarie", char zile luna = { 31, 28, 31, 30,  * e preferabila varianta urmatoare *  typedef struct { char *nume; int zile; } tip luna; tip luna luni = { {"ianuarie", 31}, , "decembrie" }; ,30, 31 }; , {"decembrie", 31} }; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 9 Un camp al unei structuri nu poate fi o structura de acelasi tip (s-ar obtine o structura de dimensiune infinita nedefinita!) Poate fi insa adresa unei structuri de acelasi tip (un pointer)! => structuri de date recursive, inlantuite (liste, arbori, etc ) struct wl {  * o lista de cuvinte *  char *word; struct wl *next;  * informatia propriu-zisa *   * pointer la acelasi tip de structura *  Un arbore binar, avand in noduri numere intregi: typedef struct t tree;  * declaratie incompleta *  struct t { int val; tree *left, *right;  * foloseste numele din typedef *  Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 10 Se pot declara campuri intregi cu un numar specificat de biti => Testarea setarea unor biti se face folosind direct numele campului fara a fi nevoie de definirea de masti si utilizarea unor operatori pe biti camp ::= nume : int const ; | : int const ; struct packet { int : 2;  * primii doi biti nu intereseaza *  int error: 1;  * un bit, semnalizeaza eroare *  int status: 3;  * un camp pe 3 biti *  int : 0;  * forteaza alinierea la octetul urmator *  int seq no: 4;  * numar de secventa pe 4 biti *  } pkt; if (pkt error) { } else if (pkt status == 5) { } else pkt seq no++; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 11 Agregate a caror valoare poate avea date de tipuri diferite, dupa caz Sintaxa: similara cu cea pentru structuri union opt nume tip { lista campuri } opt lista declaratori ; Lista de campuri este insa o lista de variante: - o variabila structura contine toate campurile declarate - o variabila uniune contine exact una din variantele date (dimensiunea tipului e data de cel mai mare camp) - o variabila uniune nu contine informatii despre varianta reprezentata - acest lucru trebuie memorat explicit in program (in alta variabila) Utilizarea si programarea calculatoarelor Curs 6 Marius Minea Tipuri definite de utilizator 12 Exemplu: un analizor lexical (prima faza a compilatorului) returneaza: - un cod intreg pt fiecare atom lexical (cuvant cheie, operator, etc ) - date suplimentare pentru identificatori (nume) si constante (valoare) enum tok { iDENT, iNUM, FNUM, DO, iF, , PLUS, , СОММА, typedef union { char *id;  * int ival;  * float fval;  * } lexvalue; sir de caractere pentru identificator *  valoare pentru constanta intreaga *  valoare pentru constanta reala *  enum tok token; lexvalue iv; switch (token) { case iDENT: printf ("° os", iv id); break; case iNUM: printf ("° od", iv ival); break; case FNUM: printf ("° of", iv fval); break; Utilizarea si programarea calculatoarelor Curs 6 Marius Minea 18 ianuarie 2005 - Verificarea programelor Java (Pathfinder, ESC Java, Bandera) - Proof Carrying Code - Combinatii cu analiza statica Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 2 Unul din primele eforturi de a verifica cod in limbaje de programare uzuale initial,(Java PathFinder 1 0): traducere din Java in PROMELA (Spin) - similaritati de limbaj: tratarea de creare dinamica de obiecte, thread-uri - dar: lipsesc alte facilitati (numere reale); necesita sursa completa Java PathFinder 2 0: verificator de sine statator, scris in Java [G Brat, K Havelund, S Park, W Visser ’OO] Arhitectura generala Model checking cu reprezentare explicita a starilor -tehnica uzuala pentru reprezentarea starilor de dim mari (structuri): fiecare val structurala stocata doar o data; inlocuita cu un cod intreg Masina virtuala Java proprie pentru model checking - + algoritmi de explorare (comanda pasi inainte inapoi in JVM proprie) - mediu nedeterminist: prin metode speciale captate de JVM Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 3 Tehnici folosite (cont ) - pentru construirea abstractiilor din program (prin slicing) - pentru identificarea conditiilor de reducere cu ordonare partiala folosind un demonstrator de teoreme, SVC (Stanford Validity Checker) , pentru detectarea potentialelor conditii de eroare - accesul concurent neprotejat la variabile comune - accesarea in ordine diferita a semafoarelor Performanta; sisteme verificate - scris in Java, de lOx mai lent ca Spin; viteza: n-1000 stari secunda - un agent de control pentru operarea in spatiu - un fragment de sistem de operare distribuit (14 clase, 1 kloc) Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 4 Prin transformare la nivelul sursa, rezulta alt program Java care opereaza cu predicatele abstracte Abstractia e specificata ca si anotatie speciala: ciass Abstract; Abstract remove(x)    abstractizeaza x Abstract addBoolean("xO", x == 0)    adauga predicatul x == 0 Se pot abstractiza si predicate peste mai multe clase: Abstract addBoolean("xGTy", A x > B y); - genereaza un predicat pentru fiecare pereche de obiecte instantiate din clasele A si В - posibila explozie a numarului de predicate Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 5 ESC = Extended Static Checking; initial pentru Modula 3, apoi Java - nu este un model checker, ci foloseste verificari prin - poate detecta erori de genul: referinte nule, depasiri de indici - pentru proprietati mai complexe, se folosesc adnotari (invarianti, preconditii, postconditii, conditii de nul nenul, etc ) - pentru verificarea se foloseste un demonstrator de teoreme (Simplify) - permite verificarea modulara, separat pentru fiecare metoda - modulele cu sursa indisponibila: suplinite prin fisiere de specificatii Analizoare statice similare exista si pentru C (fost lint, acum splint) Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 6 Un verificator modular pentru programe Java - un front-end pentru simplificarea programului (program slicing) - o biblioteca de abstractii frecvent folosite - eventual restrictia modelului la numar mic de instante de module (utilizatorul specifica pt fiecare variabila abstractia dorita) - un generator pentru un model finit intr-un format generic (limbaj cu guarded commands, tradus usor in alte limbaje de specificare) - interfete cu verificatoare uzuale (SMV, Spin, demonstratorul PVS) - un limbaj de specificare, si suport pt formule pe baza de tipare Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 7 [Necula & Lee '96, Necula ’97] - O metoda pentru executia sigura a codului lipsit de nivel cert de incredere (untrusted code) Exemplu: aplicatie via internet - Consumatorul de cod defineste niste reguli de siguranta - Furnizorul livreaza codul insotit de o demonstratie formala ca satisface regulile de siguranta - Consumatorul foloseste un verificator simplu de demonstratii pentru a stabili validitatea codului si demonstratiei primite Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 8 - Compilator cu certificarea codului (certifying compiler) genereaza cod nativ cu anotatii (ex invarianti) - Generator de conditii de verificare (VCGen) VC = predicat a carui validitate garanteaza executia sigura - Generator de demonstratii (pornind de la VC) - Un verificator de demonstratii: valideaza corespondenta intre codul si demonstratia primita (eventual: asistat de un VCGen identic cu cel anterior) Verificare formala Curs 12 Marius Minea Verificarea programelor in practica 9 - Notiunea de VC: legata de regulile pentru corectitudinea programelor, bazate pe preconditii si postconditii [Floyd ’67] - VC nu este neaparat weakest precondition (poate fi mai simpla, mai usor de exprimat si demonstrat) for (i = 0; i 0 premisa i > l s : int postconditie i definirea unei meta-semantici accesibile compilatorului - regulile specificate ca automate care tranzitioneaza la analiza sintactica a unui model (pattern) relevant din sursa - un compilator C augmentat aplica aceste extensii la analiza semantica (propagare prin graful de control, local sau global) - rezultate: sute de erori in Linux, OpenBSD, Exokernel, etc Proiect complementar: extragerea automata de modele din sursa, prin slicing (tot pentru sisteme de operare) - modelele sunt analizate apoi cu un model checker Verificare formala Curs 12 Marius Minea Marius Minea marius@cs upt ro http:  cs upt ro  marius curs lsd  13 decembrie 2016 Un arbore e un conex = drum intre orice 2 noduri (din 1 sau mai multi pasi) E compus din si (muchii) un arbore cu n noduri are n — 1 ramuri (demonstram prin ) imagine: http:  en wikipedia org wiki File:Tree graph svg Deobicei identificam un nod anume numit si muchiile in acelasi sens fata de radacina Orice nod in afara de radacina are un unic Un nod poate avea mai multi (f 7) Nodurile fara copii se numesc noduri imagine: http:  en Wikipedia org wiki File:N-ary to binary svg Arborii sunt un mod natural de a reprezenta structuri organigrama intr-o institutie arborele sintactic intr-o gramatica (ex expresie) sistemul de fisiere (subarborii sunt cataloagele) fisierele XML (elementele contin alte elemente) E   i   E + T i   i   T T * F i i i F F 4 1 i 2 3 Un arbore e un cu 0 sau mai multi => o de subarbori (frunzele au lista vida) in functie de problema, nodurile contin in exemplu: toate nodurile au informatie de acelasi S ’a tree = T ’a * ’a tree list = T(’S’,[T(’A’,[T(’a’,[])]); T(’b’,[]); T(’B’,[T(’S’, [T(’a’,[])]) ;T(’b’,[])])] ) A b В S b a a Definitia data: buna cand arborele totdeauna exista (ex : expresie) Uneori, arborele poate fi vid (ex : pentru reprezentarea de multimi) Putem defini atunci: Un arbore e fie arborele sau un cu mai multi =^- extindem tipul anterior cu o valoare pentru arborele vid tip nou = tip vechi (J{valoare-speciala} ’a option = None | Some ’a indica in ML o valoare de tipul ’a care poate eventual lipsi lucram cu valori de tipul ’a tree option None sau Some t, cu t de tip ’a tree definit anterior: ’a tree = T ’a * ’a tree list i None -> i Some T(r, tl) -> Ordinea dintre copii poate conta (ex arbore sintactic) sau nu Arborii neordonati cu 2 - 4 noduri: n n n n (argumentati: de ce sunt 12 variante liniare cu 4 noduri?) Exista n" 2 arbori neordonati cu n noduri ( ) Demonstratie frumoasa: reprezentand un arbore ca sir de n — 2 numere de la 1 la n (cititi optional despre ): sterge numarul minim, scrie nr la care era legat, pana raman 2 noduri imagine: http:  en Wikipedia org wiki File:Cayley’s formula 2-4 svg Uneori, nu avem informatie utila decat in nodurile frunza: reprezentam explicit varianta de nod frunza ’a tree = L ’a | T ’a tree list => arborele e echivalent cu o (lista de liste) [a, [b, c], [d, [e, f], g], h] dar o lista de liste trebuie sa fie uniforma pe nivele (acelasi tip) T [L ’a’; T [L ’b’; L ’c’]; T [L ’d’; T [L ’e’; L ’f’]; L ’g’]; L ’h’] imagine: R M Keller: Computer Science: Abstraction to implementation intr-un arbore binar, fiecare nod are cel mult doi copii, identificati ca fiul stang si fiul drept (oricare ambii pot lipsi) un arbore binar e fie: arborele vid un nod cu cel mult doi subarbori ’a bintree = Nil | T ’a bintree * ’a * ’a bintree instantiind pentru noduri intregi: inttree = Nil | T inttree * int * inttree Un arbore binar de inaltime n are cel mult 2n+1 — 1 noduri subarborele stang: T (T(Nil, 2, Nil), 7, T(T(Nil, 5, Nil), 6, T(Nil, 11, Nil))) subarborele drept: T (Nil, 5, T(T(Nil, 4, Nil), 9, Nil)) imagine: http:  en wikipedia org wiki File:Binary tree svg Memoreaza valori sortate in ordine: pentru fiecare nod, subarborele stang are valori mai mici, subarborele drept are valori mai mari Pot fi folositi pentru a reprezenta Cautarea: recursiv in subarborele potrivit x = srchx = i Nil -> false i T (left, v, right) -> v = x || srchx ( x fiecare obiect x e memorat intr-un tablou la indicele h(x) - matematic: o functie partiala h : D V, unde D e domeniul tuturor obiectelor posibile, iar domeniul de valori V e 0,1, , 7V - 1 - ex pt compilator: D e multimea tuturor identificatorilor - practic,  D  " |V|, deci h nu poate fi injectiva pe D, dar avem nevoie de valori distincte doar pt submultimea Du C D a obiectelor efectiv utilizate (ex identificatorii dintr-un anumit program C) - se cauta functii de dispersie (hash functions) cu proprietati cat mai bune (distributie uniforma => probabilitate mica de valori egale) Programarea calculatoarelor 2 Curs 12 Marius Minea Aplicatii Tabele de dispersie 6 - functii simple, calculate rapid, folosind (aproape) toate caracterele - adesea cu deplasari pe biti (in loc de inmultiri, si pt uniformizare) Exemple pentru siruri (char *s; len=strlen(s); parcurs secvential) for (h=len; len—;) h = ((h trebuie rezolvate (dezambiguate) pentru a permite regasirea corecta - la ce indice inseram cautam elementul daca la h(x) se gaseste altul? Programarea calculatoarelor 2 Curs 12 Marius Minea Aplicatii Tabele de dispersie 7 (closed hashing) - daca la indicele idx=h(x) se gaseste alt obiect y, se cauta succesiv dupa o anumita regula: secvential (idx++), liniar (idx+=i), cu a doua functie (idx+=h2(x)), pana se gaseste obiectul sau o intrare vida - nu pot contine mai multe obiecte decat dimensiunea tabloului => la depasire, obiectele trebuie redistribuite intr-un tablou mai mare - la stergere, intrarea in tablou trebuie marcata "sters", nu "vid", pentru a permite cautarea corecta (pana la gasire sau "vid") (open hashing) - o intrare in tablou: de obiecte cu aceeasi valoare pentru h => hashing + cautare liniara in lista (scurta pentru functii bune) - necesita alocare dinamica pentru elementele listei (v exemplu) - si aici, tablou cu dimensiune cel putin comparabila cu nr de obiecte Programarea calculatoarelor 2 Curs 12 Marius Minea 8 ianuarie 2004 Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 2 • tip de date: multimea valorilor pe care le poate lua o variabila - fiecare tip de date are definiti anumiti operatori • functiile   procedurile pot fi vazute ca o extindere a operatorilor Ex : concatenarea a doua siruri; inmultirea a doua matrici (exista chiar ca operatori in limbaje mai bogate in tipuri) • tip de date abstract: un model matematic + operatii pe acel model Ex : tipul multime (cu test de membru, reuniune, intersectie) • structura de date: colectie de variabile (posibil de tipuri diferite), pentru implementarea tipurilor de date abstracte intr-un program Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 3 - o lista (un sir) in care elementele sunt adaugate si extrase la acelasi capat, in ordinea inversa introducerii (LiFO - last in, first out) - denumire inspirata din realitate (ex o stiva de carti) • init(stiva)  * initializeaza stiva *  • empty(stiva)  * testeaza daca stiva e goala *  • push(stiva, element)  * pune pe stiva *   * pop si top necesita ca preconditie o stiva nevida *  • pop(stiva) : element  * extrage si returneaza varful stivei *  • top(stiva) : element  * returneaza varful stivei *  • full(stiva)  * testeaza daca stiva e plina *  Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 4 #define MAX 100  * dimensiunea maxima a stivei *  typedef int elem t  * sau orice alt tip dorit *  typedef struct s { elem t t [MAX]; int sp;  * indicele stivei *  } stack; void init(stack *s) { s->sp = 0; } int empty(stack *s) { return s->sp == 0; } void push(stack *s, elem t e) { if (sp t [s->sp++] = e; } elem t pop(stack *s) { return s->sp ? s->t [—s->sp] : 0; } elem t top(stack *s) { return s->sp ? s->t [s->sp-l] : 0; } int full(stack *s) { return s->sp == MAX; } Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 5 typedef int elem t; typedef struct { elem t *base, *sp, *lim; } stack; void init(stack *s) { s->base = s->sp = s->lim = NULL; } int empty(stack *s) { return s->sp == s->base; } void push(stack *s, elem t e) { if (s->sp == s->lim) { elem t *p=realloc(s->base,(s->sp-s->base+64)*sizeof(elem t)); if (!p) return;  * eroare, memorie insuficienta *  s->sp += p - s->base; s->lim += (p - s->base) + 64; s->base = p; *s->sp++ = e; elem t pop(stack *s) { return (s->sp!=s->base) ? *—s->sp : 0; } elem t top(stack *s) { return (s->sp!=s->base) ? *(s->sp-l) : 0; } Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi Varianta cu dealocarea memoriei ii elem t pop(stack *s) { elem t e = (s->sp!=s->base) ? * if (s->lim - s->sp == 64) {  * p = realloc(s->base, (s->sp-s s->lim = s->sp += p - s->base return e; Utilizarea si programarea calculatoarelor Curs 12 6 п рор() (simetric cu push): —s->sp : 0; limita pt dealocare *  ->base)*sizeof(elem t)); ; s->base = p; Marius Minea Tipuri de date abstracte Stive Cozi 7 == faptul ca detaliile de implementare sunt ascunse de utilizator Pentru folosirea stivei, ar fi suficient un fisier cu typedef int elem t;  * trebuie specificat tipul elementului *  typedef struct s stack;  * tip incomplet *  void init(stack *s); int empty(stack *s); void push(stack *s, elem t e); elem t pop(stack *s); int full(stack *s) ; implementarea: intr-un fisier compilat separat, invizibil utilizatorului -trebuie recompilat insa daca schimbam definitia elementului - o solutie: stiva de pointeri void *, nu obiecte propriu-zise Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 8 Din apelurile incuibate de functii se revine in ordine inversa fata de apel => stiva este foarte naturala pentru implementare - arhitectura procesorului: registru pentru varful stivei - pe stiva se pun in ordine: parametrii, apoi adresa de revenire, apoi in functie se creeaza variabilele locale => variabilele locale dispar la revenirea din functie => nu e corecta returnarea adresei unei variabile locale Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 9 - o lista (un sir) in care inserarea se face la un capat, si extragerea la celalalt, in ordinea introducerii elementelor (FiFO = first in, first out) • init(coada)  * initializeaza coada *  • empty(coada)  * testeaza daca coada e goala *  • enqueue(coada, element)  * adauga la coada, daca nu e plina *  • dequeue(coada) : element  * extrage din coada nevida *  • full(coada)  * testeaza daca coada e plina *  Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Tipuri de date abstracte Stive Cozi 10 #define MAX 100  * dimensiunea maxima a cozii *  typedef int elem t  * sau orice alt tip dorit *  typedef struct { elem t t [MAX]; int head, tail;  * inserare la tail, extragere de la head *  } queue; void init(queue *q) { q->tail = q->head =0; } int empty(queue *q) { return q->head==q->tail; } void enqueue(queue *q, elem t e) { if (((q->tail+l)70MAX) == q->head) return;  * coada plina *  q->t [q->tail++] = e; q->tail ° 0= MAX; elem t dequeue(queue *q) { if (q->head==q->tail) return 0;  * coada vida *  { elem t e = q->t [q->head++] ; q->head ° 0= MAX; return e; } int full (queue *q) { return ((q->tail+l)70MAX) == q->head; } Utilizarea si programarea calculatoarelor Curs 12 Marius Minea Marius Minea marius@cs upt ro http:  www cs upt ro  marius curs lsd  18 decembrie 2017 studiul matematic al grafurilor (reprezentand relatii intre obiecte) De aici a evoluat (network Science): studiul retelelor complexe: de calculatoare, telecomunicatii, energie, biologice, sociale "studiul reprezentarilor ca retele a fenomenelor fizice, biologice si sociale, ducand la ale acestor fenomene" [US National Research Council] imagine: https :   en Wikipedia org wiki Social network informai, un graf reprezinta o multime de obiecte ( intre care exista anumite ( sau Formal, un graf e o pereche ordonata G = (V, E), unde V e multimea nodurilor si E (multimea muchiilor) e o multime de perechi (u, iz) G V x V imagine: http:  en Wikipedia org wiki File:6n graf svg Un graf e daca muchiile sale sunt perechi Un graf e daca muchiile sale sunt perechi (nu conteaza sensul parcurgerii) imagini: http:  en Wikipedia org wiki File :Directed svg http:  en wikipedia org wiki File:Undirected svg Muchiile unui graf formeaza о E С V x V pe multimea nodurilor Un graf poate fi reprezentat printr-o relatie Vu, v G V (u, v) G E —> (v, u) G E intr-un graf , E e o relatie oarecare (nu trebuie sa fie simetrica, dar poate fi) Reciproc, poate fi vazuta ca un pentru (u, v) G E introducem o muchie и —> v Un (o cale) intr-un graf e o secventa de muchii care leaga o secventa de noduri xq, xn cu n > 0 astfel ca (x,-,x,+i) G E pentru orice  ' xi —> —> xn i —> xn Putem defini un drum atat in grafuri orientate cat si neorientate Un drum are un xq si un xn unui drum e numarul de muchii in particular, poate fi zero (un nod xq, fara niciun fel de muchii) sunt date de Drumurile de relatiei E: E+ = |J Ek = EU E2 U k=l a relatia Ek (k > 1) corespunde drumurilor de lungime к E2 = E o E = {(u, iz) | 3w (u, w) G E A (w, iz) G E} и —> w —> v E3 = E2 o E = {(u, iz) | 3w (u, wz) g E A (w, iz) G E2} etc 2pasi v , и w v adica и w w v Putem deasemenea defini un predicat drum cu proprietatile Vu, iz G V (u, iz) G E —> drum(u, iz) Vu, v G V (3mz g V (u, wz) g E A drum(w, iz)) —> drum(u, iz) Un e un drum de in care nodurile de inceput si sfarsit sunt aceleasi Adeseori, lucram cu cicluri in care muchiile si nodurile nu apar de mai multe ori (cu exceptia nodului initial care e si cel final) Un graf e daca are un drum de la orice nod la orice nod (definitie generala, depinde de notiunea de drum - in graf orientat sau neorientat) Pentru grafuri O e un subgraf conex maximal deci are un drum intre oricare doua noduri nu s-ar mai putea adauga alte noduri pastrand-o conexa Un graf cu n noduri si e muchii are > n — e componente conexe Demonstram prin inductie dupa e e = 0 => fiecare nod e o componenta conexa e > 1: stergem o muchie obtinem cel mult o componenta in plus Folositi ca sa demonstrati: un arbore cu n noduri are n — 1 muchii Un graf e daca are un drum de la orice nod la orice nod, si daca are un drum de la orice nod la orice nod 0 e un tare conex maximal Componentele tare conexe sunt disjuncte: relatia R(u, iz) : drum(u, iz) A drum(y, и) e o si componentele tare conexe sunt Graful orientat din figura e slab conex Are trei componente tare conexe imagine: http:  en Wikipedia org wiki File:Scc png Componentele conexe sunt orice nod e in componenta proprie un drum de la и la v e si drum de la v la и drum(u, iz) A drum(y, и ) —> drum(u, и ) Determinam componentele conexe parcurgand muchiile grafului: initial, fiecare nod e in propria componenta pentru o muchie (u, iz) componentele lui и si v Putem face asta printr-un algoritm structura Fiecare nod e singur sau legat la un nod cu care e echivalent o padure de arbori cu legaturi de la fiu la parinte (element): da reprezentantul clasei de echivalenta (radacina) (eleml, elem2): face elementele echivalente (leaga radacinile) find(X) = find(Y) = find(Z) = Z union(Y S) leaga find(Y) si find(S) : fiecare muchie are asociata o valoare numerica (poate reprezenta lungime, capacitate, etc ) numita Harta (inexacta) din Russell & Norvig, introduction to Al Def: unui nod (intr-un graf neorientat) e numarul de muchii care ating nodul Un exact o data Un exact o data e un drum care contine toate muchiile unui graf e un ciclu care contine toate muchiile unui graf Un graf conex neorientat are un ciclu eulerian daca si numai daca toate nodurile au grad par Un graf conex neorientat are un drum (dar nu si un ciclu) eulerian daca si numai daca exact doua noduri au grad impar (primul si ultimul nod din drum) reprezentarea programelor in compilatoare, analizoare de cod, etc nodurile: sau secvente liniare de instructiuni ( ) muchiile: descriu secventierea instructiunilor ( ) x := a + b; у := a * b; while (y > a) { a := a + 1; x := a -i- b } http:  vinaytech wordpress com 2008 10 04 abstract-syntax-tree  introducem o muchie f —> g daca functia f apeleaza pe g => graful de apel e ciclic daca exista functii (mutual) recursive g n = n = 0 0 1 + h (n-1) h n = n = 0 1 2 * g (n-1) n = g n + h n Daca identificam nodurile prin numere (consecutive), putem reprezenta graful ca patrata M[i,j] = 1 daca exista muchie de la i la j, altfel 0 sau M[i,j] poate contine lungimea costul muchiei Reprezentarea prin pentru fiecare nod u, lista multimea nodurilor v cu muchii (u, v) putem pastra lista intr-un (nod = cheie) e o traversare in dupa vizitarea nodului se parcurg (recursiv) toti vecinii (daca nu au fost vizitati inca) ca si cum vecinii ar fi introdusi intr-o Fie graful de mai jos, cu listele de adiacenta ordonate dupa litere Ordinea muchiilor parcurse de la a in adancime e cea indicata: 0 implementare: functie recursiva, acumuland multimea nodurilor vizitate viziteaza nodurile in ordinea distantei minime de nodul de plecare (in "valuri" care se departeaza de la nodul de pornire) nodurile inca nevizitate se pun intr-o in figura de mai jos, se indica distanta minima de la nodul a (noduri cu distanta mai mare sunt parcurse mai tarziu) 0 implementare: functie recursiva, acumuland: multimea tuturor nodurilor vizitate : multimea nodurilor noi atinse in runda curenta Recursivitate Programare dinamica Recursivitate Programare dinamica 10 ianuarie 2006 Expresiile pot fi definite recursiv, cu diagrame de sintaxa sau expresie ::= termen | expresie + expresie | expresie - expresie termen identificator | numar - simboluri : definite in functie de altele, prin -Simboluri : ex +, numar Dorim: - sa recunoastem in intrare o secventa care corespunde tiparului dat de gramatica - sa calculam valoarea expresiei idee de prelcrare: - cate o functie (cu recursivitate (in)directa) pentru fiecare neterminal - consuma din intrare terminale, sau apeleaza functii pt neterminale dupa structura gramaticii, si returneaza o valoare (pt expresie) Problema: gramatica data e : fie 5 - 4 + 2 Consideram ca expr + expr 5-4 + 2 sau expr - expr 5-4 + 2 ? => rescriem gramatica pentru a explicita asociativitatea la stanga: expresie ::= termen | expresie + termen | expresie - termen - fiecare expresie admite acum o unica din gramatica Problema: in prelucrarea expresiei, dorim sa stim citind un singur simbol din intrare pe care din ramuri (termen, +, -) sa o alegem Dar orice dezvoltare de expresie incepe pana la urma tot cu un termen! =>rescriem gramatica, factorizand si eliminand recursivitatea la stanga expresie ::= termen rest-expr rest-expr :: = e | + termen rest-expr | - termen rest-expr Programarea calculatoarelor 2 Curs 13 Marius Minea Programarea calculatoarelor 2 Curs 13 Marius Minea Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica Recursivitate Programare dinamica Recursivitate Programare dinamica Operatorii sunt de fapt un caz particular de functii, cu scriere infix => putem rescrie 5 - 4 + 2 ca fiind plus (minus (5,4), 2) in scrierea functiilor, parantezele si virgulele sunt doar o conventie; nu sunt necesare daca stim cate argumente are fiecare functie =>obtinem scrierea a unei expresii: +-542 Obtinem formatul postfix scriind fiecare functie (operator) dupa argumentele sale: 5 4-2 + - pentru probleme de optimizare - alegerea optimului local in scopul de a obtine un optim global (nu e valabila universal; uneori, e doar o euristica) Exemple: arborele minim de cuprindere intr-un graf -cand nu se poate determina sigur pasul care conduce la succes - e necesara o cautare exhaustiva in spatiul starilor - cautare recursiva (in adancime), cu revenire in caz de esec - rezolvarea unei probleme prin descompunerea in probleme mai mici - tipic: structura recursiva (exemplu: quicksort) Fie matricile Am,n (m linii, n coloane) si Bn,p (n linii, p coloane) Pentru a calcula produsul avem nevoie de m   n-p inmultiri for (i = 0; i pentru N matrici Ao • Ai • • Адг і produsele individuale pot fi calculate in diverse ordini ex pt Лю,ioo- -Sioo,5 С*5,50: (AB)C: 10 • 100 • 5 + 10 • 5 • 50 = 5000 + 2500 = 7500 inmultiri A(BC  100   5   50 + 10   100   50 = 25000 + 50000 = 75000 inmultiri : Care e ordinea calculelor pt numar minim de inmultiri ? Programarea calculatoarelor 2 Curs 13 Marius Minea Programarea calculatoarelor 2 Curs 13 Marius Minea Programarea calculatoarelor 2 Curs 13 Marius Minea Recursi vi tete Programare dinamica Recursivitate Programare dinamica Recursivitate Programare dinamica Subproblema: Care e numarul F(n) de grupari posibile de paranteze ? Solutie: relatie recursiva: pe ce pozitie 1 nr minim de inmultiri in Ai   • At e (cu separare inainte de A,): W = 0, mik = min^x , ^-! + + dtdjdt (Ai e matrice xdi+1) => calculul se poate face completand tabloul global double m[N] № ; si tabloul int p[N] [N]; cu pozitia la care se face ultima inmultire for (c = 1; c i; ) {  + pt toate pozitiile intermediare +  double v = d[i]+d [j]+d [k]+m[j] [k] ; v+=m [i] [—j] ; if (v 1 descompuneri posibile Domeniu de aplicatie: in special probleme de optimizare - cu proprietatea de descompunere optimala optimal substructure (solutia optima a problemei contine solutii optime la subprobleme) - de regula un tablou pentru cost + unul pentru a retine solutiile - consumul de memorie: adesea semnificativ (patratic sau mai mult) Programarea calculatoarelor 2 Curs 13 Marius Minea Una din sarcinile de rezolvat: in ce ordine se rezolva subproblemele (se completeaza elementele tabelului) ? Adesea: ordine naturala (ex de la indici mici) => program usor de scris Dar, nu intotdeauna e evident => abordarea recursiva e mai naturala Calculul combinarilor: = C^ 1 + pt 0 daca valoarea a fost calculata, o returneaza; daca nu, o calculeaza recursiv si o memoreaza inainte de a o returna - Calculul recursiv cu memoizare: mai natural de scris; mai eficient daca pentru rezultatul cerut nu trebuie rezolvate toate subproblemele - Calculul de jos in sus: cod mai eficient (fara apeluri de functii), dar rezolva exhaustiv toate subproblemele (chiar nenecesare) O multime de chei trebuie aranjate intr-un arbore binar de cautare (cheile din subarborele stang cii = Pi’ ci,i—l = (^1 b Vid) (suma Yjj= pj pt ca fiecare nod e cu 1 mai jos decat in subprobleme) Completarea tabloului: in ordine crescatoare a diferentei к-i (numarul de noduri), in paralel cu tabloul rik pentru radacina arborelui Se dau N (tipuri de) obiecte cu dimensiuni si si valori intregi Care e valoarea maxima a unor obiecte de dimensiune totala data D ? Problema rucsacului are multe variante i Daca se permit fragmente de obiecte, problema are solutie greedy Daca dimensiunile sunt reale, problema e NP-completa (exponentiala) Varianta 1: numar nelimitat de obiecte de fiecare tip for (d = 1; d c Ei]) c Ei] = m; Varianta 2: obiecte unice; cEd]Ei]: cost max pt dim d, obiecte 0 i for (d = 1; d l[i][j-l]) { l[i][j]=l[i-l][j]; d[i][j]=l; } else { l[i][j] = l[i] [j-1] ; d[i][j] = 2; } Programarea calculatoarelor 2 Curs 13 Marius Minea Se dau doua siruri de lungimi m si n Sa se determine costul minim al operatiilor de editare necesare pentru a transforma un sir in celalalt, prin adaugarea   stergerea   schimbarea unui caracter (Obs: schimbarea are sens daca costul primele j din у for (i = 0; i = 0; —k, —i) { c[i] [k] = DBL MAX; for (j = k; —j > i; ) { double m = w(i, j ,k) + c [i] [j] + c [j] [k] ; if (m trebuie repozitionat corespunzator indicatorul cand trecem intre citire si scriere in acelasi fisier Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (fflush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Cu functii echivalente celor folosite pana acum: int fpute(int c, FiLE *stream);  * scrie caracter in fisier *  int fgete(FiLE *stream);  * citeste caracter din fisier *   * gete, pute: la fel ca si fgetc, fputc, dar sunt macrouri *  int ungetc(int c, FiLE *stream);  * pune caracterul c inapoi *  int fscanf (FiLE *stream, const char *format, ); int fprintf(FiLE *stream, const char *format, ); int fputs(const char *s, FiLE *stream);  * scrie un sir *  int puts(const char *s);  * scrie sirul si apoi  n la iesire *  - citeste pana la (inclusiv) linie noua, sau max size - 1 caractere, adauga ’ o> la sfarsit =s  citirea sigura a unei linii, fara depasire returneaza null daca apare eof inainte de a fi citit ceva Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Fisiere 5 Fisiere #include void cat(FiLE *fi)  * afiseaza un fisier deschis caracter cu caracter *  { int c; while ((c = fgetc(fi)) != EOF) putchar(c); } void main(int argc, char *argv[]) •  FiLE *fp; if (argc == 1) cat(stdin);  * citeste de la intrare *  else while (—argc >0) {  * pt fiecare argument *  if (!(fp = fopen(*++argv, "r")))  * deschide, testeaza *  fprintf (stderr, "can’t open 7*s", *argv); else { cat(fp); fclose(fp); }  * afiseaza, inchide *  Utilizarea si programarea calculatoarelor Curs 13 Marius Minea void clearerr(FiLE *stream); reseteaza indicatorii de sfarsit de fisier si eroare pentru fisierul dat int feof(FiLE *stream);  * 1= 0: ajuns la sfarsit de fisier *  int ferror(FiLE *stream);  * 1= 0 la eroare pt acel fisier *  Daca un apel de sistem a rezultat in eroare, se poate citi codul erorii din variabila globala extern int errno; declarata in errno h Se poate folosi impreuna CU functia char *strerror(int errnum) ; din string h care returneaza un sir de caractere cu descrierea erorii Se poate folosi direct functia void perror(const char *s);  *stdio h*  care tipareste mesajul s dat de utilizator, un : si apoi descrierea erorii void exit(int status) ; *stdlib h*  termina normal executia prog - se scriu tampoanele, se inchid fisierele, se sterg cele temporare - se returneaza sistemului de operare codul intreg dat (v int mainO Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Fisiere 7 Fisiere 8 Pana acum: functii orientate pe caractere, linii, formatare (fisiere text) Pentru a citi scrie un numar de octeti, neinterpretati (in format ): size t freadCvoid *ptr, size t size, size t nmenib, FiLE *stream); size t fwrite(void *ptr, size t size, size t nmemb, FiLE *stream);  * citesc scriu nmemb obiecte de cate size octeti *  Functiile intorc numarul obiectelor complete citite scrise corect Daca e mai mic decat cel dat, cauza se afla din feof si ferror Cu ele, putem sa ne scriem functii proprii pentru fiecare tip de date: size t readintfint *pn, FiLE *stream)  * in format binar *  { return fread(pn, sizeof(int), 1, stream); } size t writedbl(double x, FiLE *stream)  * in format binar *  { return fwrite(&x, sizeof(double), 1, stream); } fprintf (fp, "7"d", n); scrie intregul ca sir de cifre zecimale cu fwrite se scrie intregul in format binar (sizeof (int) octeti Utilizarea si programarea calculatoarelor Curs 13 Marius Minea #include #include #define MAX 512  * copiem cate un sector odata *  int filecopy(FiLE *fi, FiLE *fo) { char buf[MAX]; int size;  * nr octeti cititi *  while (ifeof(fi)) { size = fread(buf, 1, MAX, fi);  * citeste MAX octeti *  fwrite(buf, 1, size, fo);  * scrie doar cati s-au citit *  if (ferror(fi) ii ferror(fo)) return errno; return 0; Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Fisiere 9 void main(int argc, char *argv[]) FiLE *fi, *fo; if (argc != 3) { fprintf(stderr, "usage: сору source destination n"); exit(l); }• else { if (!(fi = fopen(argv[l], "r"))) { fprintf(stderr, "%s: can’t open 7*s: ", argv , argv[l]); perror(NULL);  * am scris deja mesajul * ; exit(errno); if (i(fo = fopen(argv , "w"))) { fprintf(stderr, "%s: can’t open %s: ", argv , argv ); perror(NULL); exit(errno); } if (filecopy(fi, fo)) perror("Eroare la copiere"); if (fclose(fi) i fclose(fo)) perror("Eroare la inchidere"); i Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Fisiere 10 Pe langa citire scriere secventiala, e posibila pozitionarea in fisier: long fteii(FiLE "stream);  * pozitia de la inceputul fisierului *  int fseekCFiLE "stream, long offset, int whence);  * pozitionare *  Al treilea parametru: punctul de referinta pt pozitionarea cu offset: SEEK SET (inceput), SEEK CUR (punctul curent), SEEK END (sfarsit) void rewindCFlLE "stream);  * repozitioneaza indicatorul la inceput *  (echivalent CU (void)fseek(stream, OL, SEEK SET), plus clearerr Repozitionarea trebuie efectuata: - cand dorim sa "sarim" peste o anumita portiune din fisier - cand fisierul a fost scris, si apoi dorim sa revenim sa citim din el int fflushCFiLE "stream); scrie in fisier tampoanele de date nescrise pt fluxul de iesire stream Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Fisiere 11 Fisiere 12 Functiile de tipul printf  scanf pot avea ca sursa dest si siruri de char int sprintf(char *s, const char *format, ); int sscanf(const char *s, const char *format, ); Pentru sprintf, poate aparea problema depasirii tabloului in care se scrie, daca acesta nu e dimensionat corect (suficient) Se recomanda: int snprintf(char *str, size t size, const char *format, ); in care scrierea e limitata la size caractere => varianta sigura intre functii similare, trebuie alese cele corespunzatoare situatiei Ex: int n, r; char *s, *end; n = atoi(s);  * daca suntem siguri; nu semnaleaza erori *  n = strtol(s, feend, 10);  * se pot testa erori (s == end) si prelucra mai departe de la end *  r = sscanf(s, "%d", &n);  * se pot testa erori (r != 1) dar punctul de oprire in s nu e explicit (eventual cu %n) *  Utilizarea si programarea calculatoarelor Curs 13 Marius Minea - extensii (macro-uri) pentru scrierea mai concisa a programelor - preprocesorul efectueaza transformarea intr-un program C propriu-zis - directivele de preprocesare au caracterul # la inceput de linie Sinclude sau Sinclude "numefisier" - include textual fisierul numit (in mod tipic definitii) (a doua varianta: cauta intai in directorul curent apoi in cele standard) Sdefine LEN 20  * preprocesorul inlocuieste LEN cu 20 peste tot *  int tab[LEN];  * programul trebuie modificat intr-un singur loc *  for (i=0; i (В) ? (A) : (B)) Sdefine swapintfa, b) { int tmp; tmp = a; a = b; b = tmp; } fara interpretare => pot aparea probleme - folositi paranteze in Jurul argumentelor (evita erori de precedenta) - argumentele: evaluate la fiecare aparitie textuala (ex de 2xin max) => rezultat incorect la evaluarea repetata a expresiilor cu efect lateral Utilizarea si programarea calculatoarelor Curs 13 Marius Minea Recapitulare Erori frecvente Recapitulare Erori frecvente signed char e un (ca si short, int, long, long long) char e signed char (-128 127) sau unsigned char (0 255) (neprecizat) => poate fi folosit (si e convertit) ca un intreg in expresii cifra ++ intreg: ’5’ == ’0’ + 5; 7 == ’7’ - ’0’ etc (cifre, litere mari, mici: trei blocuri de caractere in tabela ASCii) Functiile din isaiphaO etc returneaza l= 0 sau 0, NU 1 sau 0 => scrieti: if (isdigit(c)) si nu if (isdigit(c) == 1) Functiile de clasificare: definite si pentru EOF == -1 (toate false) Atentie! la numere cu semn poate introduce bitul de semn, nu 0 => folositi unsigned pentru efect bine definit (introduce 0) Un caracter (’a’, valoare intreaga) NU e un sir ("a", valoare adresa) =• NU putem scrie atoiC’S’); strcatCs, ’b’); etc Programarea calculatoarelor 2 Curs 13 Marius Minea Functiile standard au nevoie de  0 pentru a detecat sfarsitul unui sir La validarea datelor, testati valoarea returnata de scanf La corectare, goliti tamponul de intrare: while (getcharO l= ’ n’); Declarati caracterul ca int pentru while ((c = getcharO) l= EOF) Testati de EOF citire, inainte sau dupa Corect while (scanf("%d", &n) == 1)) (nu doar != 0) while (fgets(s, 80, stdin)) Evitati la sfarsit de fisier: while (isspace(c = getcharO)) iese pentru c == EOF (false) while (!isspace(c = getcharO)) se blocheaza la c == EOF (true) Programarea calculatoarelor 2 Curs 13 Marius Minea Recapitulare Erori frecvente 3 Recapitulare Erori frecvente Orice tablou in C are dimensiune si => nu exista tablouri de dimensiune necunoscuta int tab[J; are element! Cand accesam (ex umplem) un tablou NU avem voie sa depasim dimensiunea alocata - la scanf NU: 7,s sau 7,[A-z] ci de ex 7,19s NU: gets DA: fgets - la 7,s: permitem 1 mai putin decat tabloul (loc pentru  0) - fgets citeste automat cu 1 mai putin decat parametrul (atentie: 7,s citeste , fgets citeste - la parcurgere NU: while ((c = getcharO) != EOF) tab[i++] = c; (trebuie verificata depasirea indicelui i) O declaratie de pointer: tip *ptr; spune: un obiect (sau tablou) de tipul tip, dar inca , pentru el => nu-l putem folosi inainte de a-i atribui o zona de memorie ! (adresa unei variabile existente, sau zona alocata dinamic) - : cand cunoastem dinainte dimensiunea char s ; NU ne complicam: char *s; s = malloc(80); if Os) - : cand stim dimensiunea in momentul apelului, printf("Cate numere"); scanf("%d", &n"); tab=malloc(n*sizeof(int)); l=strlen(s); if (p=malloc(l+l)) strcpy(p, s); else - : cand initial nu am alocat cat trebuie folosim pointerul returnat (poate muta memoria) Programarea calculatoarelor 2 Curs 13 Marius Minea Programarea calculatoarelor 2 Curs 13 Marius Minea Recapitulare Erori frecvente 5 Recapitulare Erori frecvente unui tablou e sa de inceput (o !) => numele unui tablou (inel, sir de caractere) e un (constant) => tablou [indice] sau pointer [indice] e acelasi lucru => char a , b ; a = b; NU copiaza tablouri, ci atribuie adrese ! (si da eroare de compilare, pentru ca a e constanta !) sl==s2 compara pointeri! (se suprapun?), nu continutul: strcnip(sl, s2) = NU are sens sa scriem void f(char s ) scriem: void f(char tab[]) sau void f(char *tab) (NU se transmit 20 de caractere, se transmite adresa tabloului) char tab[num] [len] ; (daca cunoastem lungimea maxima a sirului) char *tab[NUM]; fiecare element (adresa) trebuie atribuit ( ! Programarea calculatoarelor 2 Curs 13 Marius Minea Orice parametru transmis trebuie sa aiba o valoare valida, utilizabila ! => un pointer transmis trebuie sa indice o zona de memorie valida! - zona respectiva e folosita la citire sau scriere, depinzand de functie NU: char *p; strcpy(p, "un sir"); p neinitializat nealocat ! NU: char **endptr; l=strtol(sir, endptr, 10); endptr e nealocat! DA: char *endptr; l=strtol(sir, feendptr, 10); scrie valoare la feendptr O functie nu poate intoarce adresa unei variabile (ex tablou) - e alocata pe stiva => va odata cu iesirea din corpul functiei => un pointer returnat de o functie provine din a) un parametru; b) o variabila globala (problematic: suprascriere); c) alocare dinamica Un pointer returnat de o functie trebuie sa fie sau Programarea calculatoarelor 2 Curs 13 Marius Minea 10 ianuarie 2006 Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 2 Expresiile pot fi definite recursiv, cu diagrame de sintaxa sau expresie ::= termen | expresie + expresie | expresie - expresie termen ::= identificator | numar -simboluri : definite in functie de altele, prin —simboluri : ex +, numar Dorim: - sa recunoastem in intrare o secventa care corespunde tiparului dat de gramatica - sa calculam valoarea expresiei idee de prelcrare: - cate o functie (cu recursivitate (in)directa) pentru fiecare neterminal - consuma din intrare terminale, sau apeleaza functii pt neterminale dupa structura gramaticii, si returneaza o valoare (pt expresie) Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 3 Problema: gramatica data e : fie 5 - 4 + 2 Consideram ca expr + expr 5-4 + 2 sau expr - expr 5-4 + 2 ? => rescriem gramatica pentru a explicita asociativitatea la stanga: expresie ::= termen | expresie + termen | expresie - termen - fiecare expresie admite acum o unica din gramatica Problema: in prelucrarea expresiei, dorim sa stim citind un singur simbol din intrare pe care din ramuri (termen, + , -) sa o alegem Dar orice dezvoltare de expresie incepe pana la urma tot cu un termen! =^rescriem gramatica, factorizand si eliminand recursivitatea la stanga expresie ::= termen rest-expr rest-expr ::= e | + termen rest-expr | - termen rest-expr Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 4 Operatorii sunt de fapt un caz particular de functii, cu scriere infix => putem rescrie 5 - 4 + 2 ca fiind plus {minus {5,4), 2) in scrierea functiilor, parantezele si virgulele sunt doar o conventie; nu sunt necesare daca stim cate argumente are fiecare functie =>obtinem scrierea a unei expresii: +-542 Obtinem formatul postfix scriind fiecare functie (operator) dupa argumentele sale: 5 4-2 + Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 5 - pentru probleme de optimizare - alegerea optimului local in scopul de a obtine un optim global (nu e valabila universal; uneori, e doar o euristica) Exemple: arborele minim de cuprindere intr-un graf - cand nu se poate determina sigur pasul care conduce la succes - e necesara o cautare exhaustiva in spatiul starilor - cautare recursiva (in adancime), cu revenire in caz de esec - rezolvarea unei probleme prin descompunerea in probleme mai mici - tipic: structura recursiva (exemplu: quicksort) Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 6 Fie matricile Am,n (m linii, n coloane) si Bn^p (n linii, p coloane) Pentru a calcula produsul avem nevoie de m • n • p inmultiri for (i = 0; i pentru N matrici Ag • A± • • produsele individuale pot fi calculate in diverse ordini ex pt А1Одоо, B100,5, ^5,50: (AB)C: 10 • 100 • 5 + 10 • 5 • 50 = 5000 + 2500 = 7500 inmultiri A(BC): 100 • 5 • 50 + 10 • 100 • 50 = 25000 + 50000 = 75000 inmultiri Care e ordinea calculelor pt numar minim de inmultiri ? Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 7 Subproblema: Care e numarul F(n) de grupari posibile de paranteze ? Solutie: relatie recursiva: pe ce pozitie 1 nr minim de inmultiri in Aj • • Ak e (cu separare inainte de Aj): W = 0, mik = min^j^m^j-i + m^k + didjdk (А{ e matrice dt x di+1) => calculul se poate face completand tabloul global double m[N] EN]; si tabloul int p[N] EN]; cu pozitia la care se face ultima inmultire for (c = 1; c i; ) {  * pt toate pozitiile intermediare *  double v = d[i] *d[j] *d[k]+m[j] [k] ; v+=m[i] [—j] ; if (v 1 descompuneri posibile Domeniu de aplicatie: in special probleme de optimizare - cu proprietatea de descompunere optimala optimal substructure (solutia optima a problemei contine solutii optime la subprobleme) - de regula un tablou pentru cost + unul pentru a retine solutiile - consumul de memorie: adesea semnificativ (patratic sau mai mult) Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 9 Una din sarcinile de rezolvat: in ce ordine se rezolva subproblemele (se completeaza elementele tabelului) ? Adesea: ordine naturala (ex de la indici mici) => program usor de scris Dar, nu intotdeauna e evident => abordarea recursiva e mai naturala Calculul combinarilor: pt 0 daca valoarea a fost calculata, o returneaza; daca nu, o calculeaza recursiv si o memoreaza inainte de a o returna - Calculul recursiv cu memoizare: mai natural de scris; mai eficient daca pentru rezultatul cerut nu trebuie rezolvate toate subproblemele - Calculul de jos in sus: cod mai eficient (fara apeluri de functii), dar rezolva exhaustiv toate subproblemele (chiar nenecesare) Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 11 O multime de chei trebuie aranjate intr-un arbore binar de cautare (cheile din subarborele stang c[i]) c[i] = m; Varianta 2: obiecte unice; c Ed] Ei]: cost max pt dim d, obiecte 0 І for (d = 1; d l[i] [j-1]) { l[i][j]=l[i-l][j]; d[i] [j]=l; } else { l[i][j] = l[i] [j-1] ; d[i] [j] = 2; } Programarea calculatoarelor 2 Curs 13 Marius Minea Recursivitate Programare dinamica 14 Se dau doua siruri de lungimi m si n Sa se determine costul minim al operatiilor de editare necesare pentru a transforma un sir in celalalt, prin adaugarea   stergerea   schimbarea unui caracter (Obs: schimbarea are sens daca costul primele j din у for (i = 0; i = 0; —k, —i) { c[i][k] = DBL-MAX; for (j = k; —j > i; ) { double m = w(i,j,k) + + c [ j ] [k] ; if (m trebuie repozitionat corespunzator indicatorul cand trecem intre citire si scriere in acelasi fisier Pentru un fisier deschis in mod dual (cu +), nu se va citi direct dupa scriere fara a goli tampoanele (ffiush) sau a repozitiona indicatorul; nu se scrie direct dupa citire fara repozitionarea indicatorului sau EOF Utilizarea si programarea calculatoarelor Curs 13 Marius Minea